XLNet详解,xlnet

互联网时代 , 大数据充当怎样的角色?

XLNet详解,xlnet


人工智能是巧妇 , 大数据是米;大数据工程人员越来越有运维的味道 , 成为底层基础的技术;大数据与隐私的权衡 , 需要关注 。从数据本身而言 , 大数据是人工智能的核心竞争资源有人说:数据、算法、算力是人工智能的核心三大模块 。说是数据驱动的人工智能 , 不为过 。没有数据 , 算法就是巧妇难为无米之炊 , 数据是知识的外在表现形式 。
互联网时代 , 每个公司积累的大数据 , 是每个公司的战略物资 。比如电商的用户行为数据 , 比如社交领域的用户通信数据 。后续的机器学习、深度学习 , 从预测算法到客服机器人、人脸识别等等 , 背后模型都是以大量的数据为基础的 。比如NLP领域:从GPT, BERT,GPT2, Transormer-XL, XLNET, RoBERTa, 模型背后的数据越来越多 , 模型越来越重 , 精度越来越高 。
未来人工智能的落地 , 依赖于大数据 。比如金融、医疗行业 , 谁有真正的大数据 , 谁才有可能脱颖而出 。从技术角度来讲 , 大数据日趋成熟 , 成为应用的底层基础技术大数据技术越来越成熟 , 从离线数据到实时数据 , 从结构化数据到非结构化数据 , 从hadoop到spark, storm 。很多公司都有自己的大数据团队构建的大数据平台 , 有点类似运维工作的味道 。
前几年 , 你说你会hadoop;今年你肯定不好意思再这样说 , 因为大家都会hadoop的皮毛 。大数据与隐私很多人意识到了数据的重要性 , 并想方设法从中盈利 。如果你买过房子 , 不久后你可能会收到中介的电话 , 问你的房子要不要出租;或者问你的房子 , 要不要装修 。等你小孩上学 , 会收到电话 , 问你小孩要不要舞蹈、钢琴、英语培训 。
【XLNet详解,xlnet】大数据带动了数据采集的需求 。从人工收集到APP等索要各种权限 , 大数据采集的成本越来越低 。最近因为爬虫 , 很多人甚至公司整个团队被抓 , 将来预计对这方面的立法会越来越关注 。很多大公司的app, 都会要求你同意一个协议 , 里面说白了要用你的数据 , 需要你同意 。对于这些app , 鉴于市场环境 , 没法拒绝 , 除非你拒绝用它 。

    推荐阅读