hankcs
上海 松江区

加关注

大力出奇迹,没算力浑身难受[doge]

刘群MT-to-Death :官宣来了:【哪吒】预训练语言模型http://t.cn/AieRpHPa

12月10日 08:04转发|评论

【“原子”因果常识图谱】AAAI19的论文(Sap et al. (2019))开源了一个包含87万条推理常识的知识图谱ATOMIC。相较于常见的基于本体论分类条目的知识图谱,该知识库专注于“如果…那么…”关系的知识。…http://t.cn/AidvAGzF ​

11月18日 09:16转发|评论

//@52nlp: 转发微博

AINLP :ELECTRA: 超越BERT, 19年最佳NLP预训练模型 http://t.cn/AiBGKYlH

11月4日 09:47转发|评论

【定个小目标,发它一个亿条微博语料】2019最新的微博语料,可用于预训练语言模型Weibo-BERT词向量等。由于比较时新,对网络流行语的建模可能很有帮助。每个压缩包都有两千多万条,一共5个。大家下载之后也算是有一个亿…http://t.cn/Ai3sgtho ​

10月24日 10:38转发|评论

感谢大家的支持

52nlp :送10本HanLP作者新书《自然语言处理入门》,人人都能看懂的NLP入门书 http://t.cn/Ai3Nrc7C 直达:http://t.cn/Ai3Nrc7K

10月21日 00:00转发|评论

#自然语言处理入门#一个连续维护5年的开源项目HanLP的进化史:http://t.cn/RAxqdb7 感谢开源社区的每一位用户与贡献者! http://t.cn/Ai3JopWY ​

10月19日 10:57转发|评论

大牛云集

刘群MT-to-Death :欢迎参加CNCC论坛【自然语言对话:技术挑战与应用前景】。即将在苏州金鸡湖召开的中国计算机大会CNCC上,我将主办上述论坛(17日下午,A104会议室),邀请到了业界对话技术的大牛(微软周明、京东何晓冬、百度孙珂、小米王刚、阿里陈海青、华为蒋欣)共同切磋,华山论剑,交流这一领域的技术挑战 ​

10月14日 23:20转发|评论

很工程化的点子,各种logits matching:用MSE去match embedding、attention、hidden states,用softmax去match prediction,loss求和。考虑到工程量和算力,只有大组才能做这种课题,暑假想做无从下手。//@刘群MT-to-Death: 转发微博

爱可可-爱生活 :《TinyBERT: Distilling BERT for Natural Language Understanding》X Jiao, Y Yin, L Shang, X Jiang, X Chen, L Li, F Wang, Q Liu [Huazhong University of Science and Technology & Huawei Noah’s Ark Lab] (2019) http://t.cn/AimPS7sH view:http://t.cn/AimPS7sY

9月30日 10:36转发|评论

👍#中文语料#//@李正华NLP: 👍

_Wenliang_苏大NLP #人物关系抽取数据# 苏大人类语言技术研究所发布人物关系抽取数据IPRE(Inter-Personal Relationship Extraction),下载地址:http://t.cn/AiEdFqOy 。共包含34类人之间关系,超过4万标注样本。欢迎使用反馈。 ​

9月18日 21:30转发|评论

[中国赞]中秋节快乐

刘群MT-to-Death :欢乐中秋——【乐府】作诗机出品 ​

9月13日 10:36转发|评论

【语义依存分析SDP格式】本文是对SDP格式的官方文档的举例说明。对句子:More than a few CEOs say the red-carpet treatment tempts them to return to a heartl…http://t.cn/EGFNNQG ​

1月10日 05:05转发|评论

【中文语义依存分析语料库】本文介绍语义依存的语言学知识以及BH中文语义依存语料库的标注规范。给定一个句子,语义依存分析任务试图找出所有在语义上有所关联的词语对,并且预测相应的语义标签。在中文界,最有影响力的标注方案是BH-SDP,由北京语言…http://t.cn/ELk3L9e ​

2018-12-2 08:03转发|评论

【A Hierarchical Bayesian Language Model based on Pitman-Yor Processes】这篇论文通过把unigram上的Pitman-Yor语言模型拓展到ngram,提出了一种新的平滑方法…http://t.cn/R8rMabq ​

2018-2-7 14:07转发|评论

HanLP的R语言接口,包装了分词、关键词提取、简繁转换、句法分析、文本分类等接口。

第五逻辑 :对@hankcs 的自然语言处理库HanLP加了个R语言的马甲,http://t.cn/R8x2um6

2018-2-6 12:56转发|评论

【Wu Manber多模式匹配算法】AC自动机中,转移的最小单位是一个字符。也就是说,匹配后只能移动一个字符,复杂度是线性的$O(n)$。然而线性并非最快,Boyer-Moore算法在匹配后可以跳过多个字符,比线性还快。据说在实践中,利用B…http://t.cn/R8odL8Y ​

2018-2-3 06:19转发|评论