还记得是2010年，那时我刚加入IBM，开始从事人工智能平台的研发工作。当我第一次看到“逻辑回归”、“神经网络”这些词时，感觉到既神秘又新奇。从此便开启了我人工智能的学习和职业生涯。我非常庆幸自己选择了人工智能这个职业方向，因为它实在是太神奇和有趣了。每学到一个新的算法都我能感受到它的有趣，而每一次训练好的模型开始工作时，我都不禁感叹它的神奇。

目前我在国内一家公司做首席AI科学家，在我自己这从事人工智能相关的这十几年工作经历中，有三次人工智能技术的突破让我惊叹。第一次是卷积神经网络引领的计算机视觉浪潮，它让机器从此可以看懂自然世界，完成很多原来只有人才能完成的工作，并且在一些视觉任务上超越人类表现。像人脸识别的门禁，或者提取照片里的文字这些在现在看来已经不算是高科技的技术，都是在卷积神经网络出现后才达到技术的普及，改变了我们的生活。

第二次是Bert预训练模型的出现，它让机器可以理解人类语言，又进一步扩展了机器智能的边界。记得当时第一次用Bert微调的模型来判断用户评论是否是投诉信息，以及从投诉信息里提取投诉的产品和具体问题类别。识别的结果让我非常惊叹AI的语义理解能力竟然能达到如此水平。

第三次是以ChatGPT为代表的大语言模型的出现，它让机器具备了原来只有人类才有的理解、推理、生成能力，让通用人工智能看起来不再遥远。还记得第一次使用ChatGPT时对我的震撼，当时我就确信这标志着一个新时代的到来。而现在我已经习惯于有什么问题先通过ChatGPT来寻找答案，因为我发现不论我问多么细节的问题，它都能很好的理解，并给出有启发性的回答。目前大模型技术还在飞速发展着，非常庆幸能生活在这个人工智能快速发展的年代。相信在不远的将来，大模型技术一定会在人类社会的各个方面引起大的变革。

当初我在学习人工智能技术的路上参考了很多前辈的资料，现在我也想回过头来仔细再重新思考一下深度学习技术的来龙去脉，并把我的思考记录下来，以帮助初学者。另外我觉得做一件事，有趣是最重要的。所以取名叫做Rethink Fun，希望自己的教程能有深度并且有趣。同时我注册了www.rethink.fun这个域名，会在这个地址以gitbook的形式发布我的教程。

年我在学习大模型技术时，同步在B站做了技术视频进行了分享。一方面在制作视频过程中让我重新整理了自己学到的知识，加深了理解。另一方面发布视频后收到了很多人的点赞和留言。看到大家对我视频的喜欢，也让我很有成就感。我在B站的账号为RethinkFun，欢迎大家关注。

之前应清华大学出版社编辑的邀请，我出版了一本《大模型核心技术和应用》的书。不过这本书是针对有深度学习基础的读者的。你可以在学完本门课程后阅读。

RethinkFun深度学习这个教程适合初学者入门，但它不是一个速成教程。我会带着你从头开始慢慢了解深度学习技术。如果你把深度学习、人工智能作为你未来几十年的职业方向，那我建议你不妨慢下来，了解每一个技术细节，进行深入思考，相信你会从中获得乐趣。流水不争先，而在于滔滔不绝。

这个教程会涉及以下内容：

深度学习的数学基础：包括线性代数，微积分，概率与统计。
从线性回归到全连接神经网络的演进。
解决计算机视觉问题的卷积神经网络。
解决序列问题的循环神经网络。
大模型的基础架构Transformer网络。
时下最热门的大模型，包括GPT，Llama，DeepSeek。

这个教程会提供以下资源：

视频教程，在我的B站账号逐步更新。
电子书在我的个人网站。
教程附带的数据和源代码，在github可供大家下载。

最后希望你也能喜欢上人工智能技术，并从中获得乐趣。让我们开始吧！

RethinkFun深度学习

results matching ""

No results matching ""