2018,一文看尽AI发展真相(2)
时间:2019-01-02 18:08 来源:百度新闻 作者:巧天工 点击:次
AISHELL-2是AISHELL Foundation和希尔贝壳创建的开源数据库,含有1000小时中文语音数据,由1991名来自中国不同口音区域的说话者参与录制,经过专业语音校对人员转写标注,通过了严格质量检验,数据库文本正确率在96%以上,录音文本涉及唤醒词、语音控制词、智能家居、无人驾驶、工业生产等12个领域。 扬声器测量(Speaker Diarization) 语音领域顶会 ICASSP 2018,谷歌和CMU团队发表论文,汇报了他们在扬声器测量 (Speaker Diarization) 方面的进展。具体说,作者将基于LSTM的d矢量音频嵌入与最近在非参数聚类中的工作相结合,从而获得了最先进的扬声器二值化系统。 扬声器测量是指根据说话者身份将输入音频流划分为同类段的过程。它可以通过将音频流结构化为扬声器转弯来增强自动语音转录的可读性,并且当与扬声器识别系统一起使用时,通过提供说话者的真实身份。 在三个标准公共数据集 (见下) 评估结果表明,基于d矢量的二值化系统与传统的基于i-vector的系统相比具有明显的优势。在使用语音搜索领域外数据进行训练的情况下,模型在NIST SRE 2000 CALLHOME上实现了12.0%的错误率。 知识图谱和知识库 聚类 在聚类 (Clustering) 方面,根据 stateoftheart 网站,AI 做到最好的成绩是 Mukherjee 等人在 2017 年 NeurIPS 论文《论网络数据的聚类》中得到的。作者将网络概括为一个高维特征向量,然后对这些特征向量进行聚类。他们提出了两种方法,分别适用于有节点的网络和没有节点的网络。 在一系列结果中,错误率最低为 0 的情况下时间 25 秒,时间最短 2.7 秒的情况下错误率 0.1。 图 (Graph) 生成 至于图 (Graph) 生成,则是 IBM 研究院的 Tengfei Ma、Jie Chen 和 Cao Xiao 在今年 NeurIPS 发表的论文 Constrained Generation of Semantically Valid Graphs via Regularizing Variational Autoencoders 中,他们提出了一个变分自编码器的正则化框架,作为实现语义有效性的第一步。然后,专注于图的矩阵表示,并规范解码器的输出分布,以鼓励满足有效性约束。实验结果证实,与此前文献报道的其他方法相比,我们的方法在采样有效图的准确率要高得多。 具体说,他们所提出的方法,在 QM9 与 ZINC 两大数据集上,分别与此前最好结果相比,都得到了显著提升。 链路预测 今年的ICLR,Rajarshi Das 等人提出了一种名叫 Minerva 的算法,有效解决了回答关系已知但只有一个实体的问题。作者提出了一种神经强化学习方法,能够学习如何根据输入的查询条件在图中导航,从而找到预测路径。这种方法在几个数据集上获得了最先进的结果,明显优于先前的方法。 程序归纳与程序综合 在发表于今年 ICLR 的一项工作中,佐治亚大学和微软研究院的研究人员联合提出了一种叫“神经引导演绎搜索”(NGDS)的方法,这是一种混合程序综合技术,结合了符号逻辑和统计模型的优点。因此,NGDS 能通过构造生成满足所提供规范的程序,并且很好地概括了类似于数据驱动系统的看不见的样本。 论文作者提出的这一的技术,有效地利用演绎搜索框架,将神经元件的学习问题简化为简单的监督学习场景。此外,这可用现实世界数据,又可以利用强大的递归神经网络编码器。与最先进的系统相比,通过综合精确的程序,整体速度提高了12倍,准确率68.5%。 当然,对于程序综合与程序生成,在条件程序生成领域,还必须提一下今年的EMNLP,Murali 等人提出的一个模型,结合深度学习和程序综合技术,能够自动学习将简单的手绘图转换为用 \LaTeX 图形程序。 论文作者学习了一个卷积神经网络,后者能提出解释图的合理绘图基元,可以纠正深层网络所产生的错误,通过使用类似的高级几何结构来测量图形之间的相似性,并推断出图程序。总之,这是朝向智能体从感知输入中归纳出有用的、人类可读的程序又一进步。 2018 年人工智能大事件回顾 看完技术在聚焦产业。尽管AI技术为谷歌和Facebook这样的大公司的盈利颇丰,但今年,这些公司已经越来越意识到AI技术的一些陷阱:比如AI很容易陷入偏见,缺乏固定的技术道德准则,而且,过早地将AI技术引入现实世界可能是浪费时间。 今年关于AI技术应用的争议中,有很大一部分是由Uber自驾车事故致行人死亡事件引起的。此外,人工智能技术可能存在滥用的报道也引发了新的关注。 以下是新智元呈现的2018年AI大事件年度盘点,其中一些事件凸显出当前AI技术中存在的重要问题: 1月 中国公司正在占领CES,官方数据显示,单是名字中含有“深圳”的参展公司就有482家,占了将近10%,算上其他来自中国的公司,2018年的CES已经成为“中国消费电子展”。 教育部:人工智能进入全国高中新课标,2018秋季学期执行 2月 美国国会举行关于AI技术的听证会,发言人警告称,AI领域长期存在偏见,特别是对有色人种的偏见。 工业界和学术界专家于2月的一份报告中强调了AI技术在数字、物理和政治领域可能被武器化,并存在被滥用的多种方式。 研究人员Joy Buolamwini和Timnit Gebru发表论文,显示AI面部识别的准确性在白人和有色人种间存在巨大差异。 谷歌重拳开放Cloud TPU,GPU最强对手上线 3月 Uber实验性自动驾驶汽车在亚利桑那州撞死了一名行人 中国两会:总理报告再提新一代人工智能 体系结构宗师John Hennessy、David Patterson获图灵奖 【新智元峰会】德国AI教皇盛赞中国人工智能,25位AI领袖强势打造中国新智极 4月 Facebook 20 亿用户数据均可能泄露,扎克伯格仍不打算辞职 5月 谷歌首次出现集体请辞,抗议军方合作项目,300多名学者发联名信 提升AI公平性的工具开始开发 Facebook发布用于识别数据偏见的工具,并开始测试相关算法 6月 谷歌中止Maven军事合作,曾打算帮国防部监控地球建筑 7月马斯克联名2000多AI专家誓言禁绝杀人机器人 8月 Open AI完虐Dota2准职业玩家,推塔如割草 六项世界第一!余承东发布7纳米“超级恐怖”芯片,麒麟980让世界颤抖 亚马逊Alexa和微软Cortana完成整合,挑战苹果Siri 9月 更多旨在提升AI公平性的工具面世,美国国会进一步关注AI公平性问题 Google和IBM陆续发布了用于识别数据偏见的工具。 有国会议员致函FBI和平等就业机会委员会等联邦机构,询问它们是否制定了旨在缓解AI技术偏见的工具或政策。 阿里成立独立芯片公司——平头哥 AI world 2018 世界人工智能峰会在北京举行 10月 亚马逊打击有偏见AI的报道。路透社报道称,亚马逊正在测试一种对女性存在偏见的AI招聘工具。 NLP历史突破!谷歌BERT模型狂破11项纪录,全面超越人类 MIT宣布10亿美元成立全新计算与人工智能学院,重塑70年来结构 11月 新闻联播8分钟:中央强调AI要有“头雁”效应,要勇闯无人区 北大建立人工智能新校区,规划用地1025亩 谷歌无人车老大承认遥遥无期,全自动驾驶寒冬将至? 12月 微软发表官方博文,推动对面部识别算法的偏见进行监管。 Science:AlphaZero达成终极进化体,史上最强棋类AI降临 专家表示,AI背后社会科学基础并不像宣传的那样扎实,并提出了监管AI技术的意见。 谷歌翻译声称,已在翻译中修复可能存在偏见的性别代词 欧盟公布AI技术道德准则草案,同时实现了AI投资200亿美元的目标 AI Index 2018 公布 世界最大AI创新应用园揭幕:首钢老厂区将变身新北京“AI World” (责任编辑:波少) |