当前位置: 首页 > news >正文

**AI的三大支柱:神经网络、大数据与GPU计算的崛起之路**

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

在普林斯顿攻读计算机科学研究生的第一个学期,我选修了COS 402课程:人工智能。在学期接近尾声时,有一节课讨论了神经网络。这是在2008年秋季,那堂课和教材都给我留下了深刻印象,似乎神经网络已经变成了一个“无人问津”的领域。

神经网络在20世纪80年代末和90年代初取得了一些令人瞩目的成果,但后来进展停滞。到2008年,许多研究人员已经转向了支持向量机等更具数学美感的方法。

当时我并不知道,就在我听课的同一栋计算机科学大楼里,普林斯顿的一个团队正在开展一个即将颠覆这一传统观点的项目。该团队由李飞飞教授领导,他们的目标并不是改进神经网络,事实上,他们几乎没有考虑神经网络,而是致力于创建一个远大于以往的图像数据集:1400万张图像,每张都标注了约2.2万个类别之一。

李飞飞教授在她的回忆录《我所见的世界》中讲述了ImageNet的故事。她在2007年开展该项目时,面临了很多朋友和同事的质疑。

“我认为你这个想法走得太远了,”一位导师在2007年对她说,“关键是要跟随领域的发展,而不是超前太多。”

不仅仅是因为创建如此庞大的数据集在后勤上是个巨大挑战,人们还怀疑当时的机器学习算法是否能从如此大量的图像中获益。

“ImageNet之前,人们根本不相信数据的价值,”李在计算机历史博物馆的采访中说道,“当时所有人都在研究完全不同的AI范式,数据量极少。”

尽管有负面反馈,李飞飞坚持了两年多,这不仅消耗了她的研究预算,也考验了她研究生团队的耐心。2009年她在斯坦福大学开始新工作时,带着ImageNet项目和几个学生一起搬到了加州。

ImageNet在2009年发布后的头几年并未受到广泛关注。然而在2012年,多伦多大学的一支团队使用ImageNet训练了一个神经网络,在图像识别方面取得了前所未有的表现。这个被称为AlexNet的突破性AI模型开启了延续至今的深度学习浪潮。

AlexNet的成功离不开ImageNet数据集,同时也得益于英伟达的CUDA平台,使GPU得以用于非图形应用。当英伟达在2006年发布CUDA时,许多人对此持怀疑态度。

因此,过去12年间的AI热潮得益于三位坚持不懈的先驱。第一位是杰弗里·辛顿,多伦多大学的计算机科学家,他几十年来推广神经网络,尽管几乎普遍受到了质疑。第二位是英伟达的CEO黄仁勋,他早在创立GPU之初就意识到GPU不仅仅适用于图形处理。第三位是李飞飞,她创建了一个看似荒谬的巨型图像数据集,最终成为神经网络在GPU上成功应用的关键要素。

辛顿和他的同事们在1986年发表了一篇具有里程碑意义的论文,描述了反向传播技术,使得训练深层神经网络成为可能。他们从网络的最后一层开始,逐层反向传播梯度,从而逐步调整每一层的参数。这一创新重新激发了对神经网络的兴趣。

与此同时,黄仁勋则在1999年发明了GPU,大大提高了平行计算能力。英伟达在2006年推出CUDA平台,尽管起初反响平平,但最终为深度学习的崛起奠定了基础。2009年,辛顿的团队首次利用CUDA平台训练神经网络,使神经网络的训练速度提升了数百倍。

李飞飞通过ImageNet项目提供了神经网络所需的大规模数据。她在斯坦福大学的头几年,尽管遭遇了项目初期的冷淡反响,但通过ImageNet挑战赛吸引了广泛关注。2012年,多伦多大学团队的AlexNet模型在ImageNet比赛中遥遥领先,引发了计算机视觉领域的震动。该模型由数千万个参数组成,其表现证明了深层神经网络的潜力。

AI界迅速意识到AlexNet的重要性。辛顿的团队成立了一家公司,并在几个月后被谷歌以4400万美元收购,辛顿成为谷歌AI团队的一员。而Nvidia的GPU则成为训练神经网络的行业标准。到2012年,Nvidia的市场估值不到100亿美元,如今,Nvidia已经成为世界上最有价值的公司之一,市值超过3万亿美元。

正如李飞飞在9月一次采访中所言,现代AI的三大支柱——神经网络、大数据(ImageNet)和GPU计算——在那个时刻首次交汇。如今,主流AI实验室认为,训练超大规模模型和海量数据集是推动AI进步的关键。这似乎符合AlexNet的经验教训,但我们也要小心,不要让这些经验变成不可撼动的教条。


http://www.mrgr.cn/news/67241.html

相关文章:

  • 矩阵的奇异值分解SVD
  • Netty原来就是这样啊(二)
  • 设计模式-构建者
  • 宠物领养救助管理软件有哪些功能 佳易王宠物领养救助管理系统使用操作教程
  • webpack的常见配置
  • 基于uniapp和java的电动车智能充电系统软件平台的设计
  • RHCE作业四
  • 实验7-3-4 字符串替换
  • 2024年11月7日 十二生肖 今日运势
  • 【前端】MQTT:通信与聊天室实战
  • 三十三、Python基础语法(面向对象其他语法-下)
  • 非关系型数据库NoSQL的类型与优缺点对比
  • 基于 Vue3、Vite 和 TypeScript 实现开发环境下解决跨域问题,实现前后端数据传递
  • 代码随想录第十八天| 530.二叉搜索树的最小绝对差 、 501.二叉搜索树中的众数 、236. 二叉树的最近公共祖先
  • 【FPGA】Verilog:理解德摩根第一定律: ( ̅A + ̅B) = ̅A x ̅B
  • 【真题笔记】21年系统架构设计师要点总结
  • dns服务器配置
  • Java项目实战II基于Spring Boot的问卷调查系统的设计与实现(开发文档+数据库+源码)
  • 源文件到可执行文件流程
  • LeetCode17. 电话号码的字母组合(2024秋季每日一题 59)
  • IDEA构建JavaWeb项目,并通过Tomcat成功运行
  • C语言程序的机器表示(逆向+函数调用栈详解版)
  • 【入门篇】2.10 串口打印Helloworld
  • VisionPro —— 颜色匹配工具详解
  • Linux APT 教程:从入门到精通
  • [C语言]多组输入的几种方法