大力出奇迹,没算力浑身难受[doge]
【“原子”因果常识图谱】AAAI19的论文(Sap et al. (2019))开源了一个包含87万条推理常识的知识图谱ATOMIC。相较于常见的基于本体论分类条目的知识图谱,该知识库专注于“如果…那么…”关系的知识。…http://t.cn/AidvAGzF
//@52nlp: 转发微博
【定个小目标,发它一个亿条微博语料】2019最新的微博语料,可用于预训练语言模型Weibo-BERT词向量等。由于比较时新,对网络流行语的建模可能很有帮助。每个压缩包都有两千多万条,一共5个。大家下载之后也算是有一个亿…http://t.cn/Ai3sgtho
感谢大家的支持
#自然语言处理入门#一个连续维护5年的开源项目HanLP的进化史:http://t.cn/RAxqdb7 感谢开源社区的每一位用户与贡献者! http://t.cn/Ai3JopWY
大牛云集
很工程化的点子,各种logits matching:用MSE去match embedding、attention、hidden states,用softmax去match prediction,loss求和。考虑到工程量和算力,只有大组才能做这种课题,暑假想做无从下手。//@刘群MT-to-Death: 转发微博
👍#中文语料#//@李正华NLP: 👍
【语义依存分析SDP格式】本文是对SDP格式的官方文档的举例说明。对句子:More than a few CEOs say the red-carpet treatment tempts them to return to a heartl…http://t.cn/EGFNNQG
【中文语义依存分析语料库】本文介绍语义依存的语言学知识以及BH中文语义依存语料库的标注规范。给定一个句子,语义依存分析任务试图找出所有在语义上有所关联的词语对,并且预测相应的语义标签。在中文界,最有影响力的标注方案是BH-SDP,由北京语言…http://t.cn/ELk3L9e
【A Hierarchical Bayesian Language Model based on Pitman-Yor Processes】这篇论文通过把unigram上的Pitman-Yor语言模型拓展到ngram,提出了一种新的平滑方法…http://t.cn/R8rMabq
HanLP的R语言接口,包装了分词、关键词提取、简繁转换、句法分析、文本分类等接口。
【Wu Manber多模式匹配算法】AC自动机中,转移的最小单位是一个字符。也就是说,匹配后只能移动一个字符,复杂度是线性的$O(n)$。然而线性并非最快,Boyer-Moore算法在匹配后可以跳过多个字符,比线性还快。据说在实践中,利用B…http://t.cn/R8odL8Y