AI 是啥
和很多朋友聊天的时候,我发现即使是很多软件行业从业者,对生成式 AI 的原理其实也几乎完全没有感知。人们一直都知道机器学习,神经网络这类词汇,但这玩意究竟如何工作,其实很难一言蔽之。
当前是 2023 年,实际上,虽然很多人把 2022 年作为 AI 元年,如今并不长的一段时间后,大模型的热度已经逐渐冷却,人们意识到大模型的局限,算力的匮乏,以及对应的落地场景竟然比想象中的少而困难,创业团队们也开始把风口逐渐的转向专精的小模型们,专精的场景。
但大模型终究还是出来了,也真的产生了不可估量的价值,但由于其运行原理的特殊性,竟然诞生出了 Prompt 工程师这样神奇的岗位。Prompt 工程师本质上就是比你更懂模型原理的人,用看起来啰嗦而反复的「咒语」,让愚笨的大模型吐(生成)出更精确的答案。
所以,我始终觉得,如何你希望更好的使用这些已经存在模型,你并不需要是 AI 行业的直接从业者,定性(区分于定量)的理解仍然可以很有用。
路径
我个人推荐的路径大概是这样的,难度由难到简,其实符合很多知识的学习曲线,入个大门槛有点辛苦,但之后的路会特别开阔。
Coursera 课程 - Neural Networks and Deep Learning
看图就知道,如果肝一点,甚至一天就可以学完这门课。而你只需要会一点点 Python 基础,就可以跟着做完一整套练习。
这门课让你用最浅显上手的方式,跨入机器学习的门槛,让你知道机器学习根本不是什么高深莫测的技术,不过是最简单的递归和算法形成的数学设计,是人类智慧的一点点系统性实现。
跨过这道门槛,图像,语音,自然语言识别到数据模型之间的转换,你就不会觉得多莫遥不可及了。
机器学习场景的简单实现
说白了,就是用最简单的现成的框架,去实现最简单的机器学习的场景。
这里推荐 Sklearn,这是最即开即用的 Python 封装,配合下面这张 CheatBook,初步的了解一下所有机器学习的模型,算法和对应的使用场景,也许脑子里就能够建立最完整的(虽然粗糙的)地图 MOC(Map of Content)。
我自己在生活里的入门的场景是两个:
项目1:基于监督学习的算法去计算股票价格的走势(当然不赚钱,但是不方案你练习必要的技能,和理解从显示生活的数据到模型数据的转换思路)
项目2:基于非监督学习的知识案例库建设:把历史上的上万生产事故单,用 NLP(自然语言处理) 向量化以后,放入非监督学习的模型中,形成自动去重,具有基本语意检索能力的小模型。
由此,你就有了自己的实践经验,虽然里商用的工程化的实践经验仍然有 9999 年的距离,但不妨碍你可以定量的思考所有 AI 背后的原理,也更容易看懂相关的论文一些。毕竟大部分目前的 AI,也不过是算力,参数和数据量突破的某一个奇点以后,形成的所谓涌现。
论文
学习,终究还是应该回到正途的。没有什么比看论文的学习效率更高了。
推荐已经存在的相关论文和知识点的大合集:
https://gofurther.feishu.cn/docx/Enofdl25BotoVrxth8ec4rNBn5c
然后
每次最后都要写个然后,其实也没有什么然后。
如果你对一个新的技术感兴趣,扎实一些的做法,还是把手弄脏一些,亲自下场摸一摸。
风口真不应该只是人们口里的风。