还记得是2010年,那时我刚加入IBM,开始从事人工智能平台的研发工作。当我第一次看到“逻辑回归”、“神经网络”这些词时,感觉到既神秘又新奇。从此便开启了我人工智能的学习和职业生涯。我非常庆幸自己选择了人工智能这个职业方向,因为它实在是太神奇和有趣了。每学到一个新的算法都我能感受到它的有趣,而每一次训练好的模型开始工作时,我都不禁感叹它的神奇。
目前我在国内一家公司做首席AI科学家,在我自己这从事人工智能相关的这十几年工作经历中,有三次人工智能技术的突破让我惊叹。第一次是卷积神经网络引领的计算机视觉浪潮,它让机器从此可以看懂自然世界,完成很多原来只有人才能完成的工作,并且在一些视觉任务上超越人类表现。像人脸识别的门禁,或者提取照片里的文字这些在现在看来已经不算是高科技的技术,都是在卷积神经网络出现后才达到技术的普及,改变了我们的生活。
第二次是Bert预训练模型的出现,它让机器可以理解人类语言,又进一步扩展了机器智能的边界。记得当时第一次用Bert微调的模型来判断用户评论是否是投诉信息,以及从投诉信息里提取投诉的产品和具体问题类别。识别的结果让我非常惊叹AI的语义理解能力竟然能达到如此水平。
第三次是以ChatGPT为代表的大语言模型的出现,它让机器具备了原来只有人类才有的理解、推理、生成能力,让通用人工智能看起来不再遥远。还记得第一次使用ChatGPT时对我的震撼,当时我就确信这标志着一个新时代的到来。而现在我已经习惯于有什么问题先通过ChatGPT来寻找答案,因为我发现不论我问多么细节的问题,它都能很好的理解,并给出有启发性的回答。目前大模型技术还在飞速发展着,非常庆幸能生活在这个人工智能快速发展的年代。相信在不远的将来,大模型技术一定会在人类社会的各个方面引起大的变革。
当初我在学习人工智能技术的路上参考了很多前辈的资料,现在我也想回过头来仔细再重新思考一下深度学习技术的来龙去脉,并把我的思考记录下来,以帮助初学者。另外我觉得做一件事,有趣是最重要的。所以取名叫做Rethink Fun,希望自己的教程能有深度并且有趣。同时我注册了www.rethink.fun这个域名,会在这个地址以gitbook的形式发布我的教程。
年我在学习大模型技术时,同步在B站做了技术视频进行了分享。一方面在制作视频过程中让我重新整理了自己学到的知识,加深了理解。另一方面发布视频后收到了很多人的点赞和留言。看到大家对我视频的喜欢,也让我很有成就感。我在B站的账号为RethinkFun,欢迎大家关注。
RethinkFun深度学习这个教程适合初学者入门,但它不是一个速成教程。我会带着你从头开始慢慢了解深度学习技术。如果你把深度学习、人工智能作为你未来几十年的职业方向,那我建议你不妨慢下来,了解每一个技术细节,进行深入思考,相信你会从中获得乐趣。流水不争先,而在于滔滔不绝。
这个教程会涉及以下内容:
- 深度学习的数学基础:包括线性代数,微积分,概率与统计。
- 从线性回归到全连接神经网络的演进。
- 解决计算机视觉问题的卷积神经网络。
- 解决序列问题的循环神经网络。
- 大模型的基础架构Transformer网络。
- 时下最热门的大模型,包括GPT,Llama,DeepSeek。
这个教程会提供以下资源:
最后希望你也能喜欢上人工智能技术,并从中获得乐趣。让我们开始吧!