大数据、人工智能技术发展已上升为国家战略,相关技术将成为推动行业增长的下一个引擎!国家文号召人工智能人才培养的重要意义与重大战略,人工智能人才培养作为技术发展的基础之一,如何在新的时代号召下寻求更大的发展与变革是当务之急! NLPIR大数据语义智能教学科研平台是大数据语义智能分析专业的教学科研综合平台。平台以自然语言理解为核心,结合北理工团队多年的科学研究与*教学经验,以科学严谨的方式,致力于提升学员大数据与人工智能的教学培训、科学研究与工程实践的水平。 NLPIR大数据语义智能教学科研平台的主要范畴包括: 1)科学认知。培养学员大数据、人工智能那个与自然语言理解的科学认知观。 2)基础理论。基础理论包括机器学习、深度学习以及人工智能常见算法。 3)关键技术。平台关键技术以自然语言理解为基础,包括汉语分词、新词发现、关键词提取、文本分类聚类精准搜索、知识图谱以及其他相关技术。 4)工具平台。成熟的工具平台有:NLPIR语义搜索与挖掘平台、Hadoop、Spark、Hive等大数据平台和TensorFlow等人工智能平台。 5)实战应用。结合实际问题,提升语义智能实战应用能力和二次开发能力。 NLPIR大数据语义智能教学科研平台教学内容丰富,主要围绕大数据、人工智能和自然语言理解三大核心领域展开,核心内容包括以下几个方面: 1)科学的大数据观:大数据的定义,科学发展渊源;如何科学看待大数据?如何把握大数据,分别从“知着”、“显微”、“晓义”三个层面阐述科学的大数据观。 2)大数据技术平台与架构:云计算技术与开源平台搭建;Hadoop、Spark等数据架构、计算范式与应用实践;TensorFlow深度学习平台。 3)机器学习与常用数据挖掘:常用机器学习算法:Bayes, SVM,深度神经网络等;常用数据挖掘技术:关联规则挖掘、分类、聚类、奇异点分析;深度学习:CNN, RNN, LSTM, Attention模型,seq2seq模型。 4)大数据语义精准搜索:通用搜索引擎与大数据垂直业务的矛盾;大数据精准搜索的基本技术:快速增量在线倒排索引、结构化与非机构化数据融合、大数据排序算法、语义关联、自动缓存与优化机制;大数据精准搜索语法:邻近搜索、复合搜索、情感搜索、精准搜索; 5)非结构化大数据语义挖掘 语义理解基础:ICTCLAS与汉语分词;内容关键语义自动标引与词云自动生成;大数据聚类;大数据分类与信息过滤;大数据去重、自动摘要;情感分析与情绪计算;不良信息智能过滤. 6)知识图谱的大数据自动构建与应用:知识图谱概念;知识点的自动发现;基于bootstrapping的知识大数据生成; 7)NLPIR智能语义平台:NLPIR智能语义分析在线云服务;NLPIR Parser语义分析平台实训;NLPIR智能语义二次开发接口与教程。 8)大数据应用案例剖析与综述:国家电网大数据应用案例;新媒体传播创新与头条应用;非结构化大数据挖掘。 随着国家大数据战略的全面推进,我国大数据产业发展迎来“黄金期”,数据驱动的创新正逐步向经济社会各行业领域融合应用,拓展出行业发展新空间,助力行业结构转型升级。同时,随着双创战略、网络强国建设、互联网+行动计划等国家战略的深入实施,为大数据、物联网、人工智能等新兴技术与产业融合发展带来新机遇,成为助推数字经济创新发展的新动能。
词条
词条说明
Internet技术的发展与成熟,使得人们可获得的信息越来越多。面对海量信息,人们已经不能简单地靠人工来处理所有的信息,需要辅助工具来帮助人们更好地发现、过滤和管理这些信息资源。 与拉丁语系的文本不同,中文并不使用空格作为词语间的分隔符。比如当我们说“We love coding.”,这句英文使用了两个空格来分割三个英文词汇;如果用中文做同样的表述, 就是“我们爱写代码。”,其中不包含任何空格。
汉语分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。中文分词是其他中文信息处理的基础,搜索引擎只是中文分词的一个应用。其他的比如机器翻译(MT)、语音合成、自动分类、自动摘要、自动校对等等,都需要用到分词。 汉语自动分词是目前中文信息处理领域公认的一大难题,也是自然语言理解研究领域
自然语言通常是指一种自然地随文化演化的语言。英语、汉语、日语为自然语言的例子,而世界语则为人造语言,即是一种为某些特定目的而创造的语言。 自然语言具备两个属性:语言属性与自然属性。“语言”属性表现为公认的某些约定俗成的内在规律性;“自然”属性是说并不存在某个人为制造的、严格的语法规则体系来约定人们的语言表达方式,这是和程序设计语言大相径庭的。自然语言需要遵循一定的内在规律,但更大程度上是“存在即
进入21世纪,面对网络时代信息的爆炸式增长,中文信息处理作为一项基础性、普适特性的信息技术,面临着挑战和再次发展的机遇,在互联网时代则显示出其优势。它的开发利用关系到我国今后信息产业乃至社会经济的发展和安全,具有巨大的经济价值和社会价值。 中文信息处理包括了有关中文信息的采集、存储、传输和利用,是指利用电子计算机和现代通信、照明、排版、等自动化技术对汉字信息进行输入输出整理、加工、转换、传输、复
公司名: 灵玖中科软件(北京)有限公司
联系人: 张宝
电 话: 010-62648216
手 机: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀区苏州街49-3号盈智大厦5层
邮 编: