序言
现在是除夕深夜,随着此起彼伏的爆竹声,注定是个难眠之夜,不如借此机会写篇文章,作为对你的新年祝福,也作为对自己的年度总结。
求索,可能是我最近的关键词,不管是在生活中,还是在工作上。正如深度求索公司关联屈原《离骚》中的“路漫漫其修远兮,吾将上下而求索”。

这篇主要写写我在工作上的求索,尤其是这两年专注的 AI 项目,算上个人组织和公司项目,大大小小有十余个,能分享的会在下文一一介绍。
之前阶段性总结写过《5 年,1 项目,0 收入!为何我还傻傻坚持?》《我当打工人&自由人,国内&海外做 AI 产品的复盘:不想失败千万别这样做!》,
这次写一篇全面性的总结,作为对过去两年工作的回顾,也作为对未来工作的展望。
我与 AI 的缘起
认识我的朋友或许知道我是科班程序员,虽然不是 AI 专业,但毕业的第一份工作是负责游戏 AI Bot 算法的开发和优化,算是了解 AI 在商业项目中的实际应用。
更重要的是,因为我很喜欢《A.I.》、《The Terminator》等科幻电影,让我不仅乐于在现实中实践,更热衷对理想的探索。
chatgpt web - 我实践的首个 LLM 项目
发布时间:2023.03
项目价值不大,我不再部署维护。
2023 年,AI 届的明星产品非 ChatGPT 莫属,所以当时出现了很多 ChatGPT 的套壳项目,而我实践的首个 LLM 项目,正是基于 ChatGPT 的套壳项目 chatgpt-web https://github.com/Chanzhaoyu/chatgpt-web。
当然还有很多其他 ChatGPT 套壳项目,比如 ChatGPT-Next-Web 等,但技术栈和实现方式都大同小异。
做这个项目的目的很简单,就是想实操下 ChatGPT 套壳项目的开发和部署。
最大的收获,就是我学会用 Cloudflare 实现代理 API 请求,这在国内调用 OpenAI API 时非常有用。
技术栈:
前端:Vue.js
后端:TypeScript
数据库:MySQL
其他:Docker
实现效果如下图:

AI 健身教练微信机器人 - 我结合兴趣做的 AI 项目
发布时间:2023.05
兴趣是最好的老师,而我当时最大的兴趣就是健身,所以结合兴趣做的 AI 项目,就是 AI 健身教练微信机器人。
我是基于 chatgpt-on-wechat https://github.com/zhayujie/chatgpt-on-wechat 这个项目,做了一些定制化开发,包括消息提醒和总结,夸夸回复和统计排行,实现了健身教练的微信机器人。
虽然自己觉得健身领域可 AI 化程度不高,但我觉得这个项目还是很有意义的,不仅结合自己的兴趣实践项目,还组织了团队做了很多开发之外的事情。包括运营推广、活动策划、用户反馈等。
技术栈:
后端:Python
其他:Docker
实现效果如下图:

RealChar - 我参与的首个开源 AI 项目
发布时间:2023.06
项目网址:https://realchar.ai/
那段时间,我很关注 AI 的最新消息,尤其是一些热门项目,比如 RealChar https://github.com/Shaunwei/RealChar。
RealChar 是一个类似 Character AI 的角色扮演聊天应用,但最初项目比较简陋,创建角色只能通过编写代码。
我在项目开源的初期就参与了项目,熟悉了项目代码,并跑通了主要流程的开发和部署。
项目在迭代多次后,功能和体验不亚于 Character AI,甚至更胜一筹。但可惜的是,项目主要开发者 @Shaunwei 重心转向了新项目,此项目也就没再维护了。
技术栈:
前端:React
后端:Python
数据库:SQLite,Chroma
LLM:OpenAI,Anthropic
STT:Whisper
TTS:ElevenLabs
Voice Clone:ElevenLabs
其他:Docker
实现效果如下图:

AI Town - 我参与的首个 AI Agent 项目
发布时间:2023.09
项目网址:https://www.convex.dev/ai-town
作为首个 AI Agent 项目,AI Town 及其论文 https://arxiv.org/pdf/2304.03442 当时非常火爆,我在第一时间熟悉项目,并参与其中开发。
AI Town 是个非常有趣的项目,但也是个非常费钱的项目,多个 Agent 的 token 消耗非常惊人。所以作为独立开发者的我,只是浅尝辄止,没有深入研究。
技术栈:
Game: Convex
Auth: Clerk
Local inference: Ollama
LLM: OpenAI
实现效果如下图:

音缘 AI 音乐 - 我做的一个 AI 音乐微信小程序
发布时间:2024.04
项目网址:https://me.ifree.love/project/musicmate-ai-music/
做这个项目的原因,一是因为我很喜欢音乐,二是正好蹭 Suno AI 的热度。
当时正好在 @idoubi 的社群中,看到他正在做 melodis.co ,于是我向他要了一份爬取的音乐数据,并打算做一个 AI 音乐小程序。
我最初的构想是做一款 AI+社交的音乐产品,因为我之前做过一款音乐社交小程序——寻找最佳音缘。
但是由于开发加审核时间超出预期,做完 AI 部分后,就去做别的项目了,社交部分也就不了了之了。
技术栈:
前端:微信小程序
后端:NextJs
数据库:PostgreSQL
LLM:Suno
其他:Docker
实现效果如下图:

unigpt.vip - 我用来学习 SEO 未成的 AI 聚合站
发布时间:2024.05
项目网址:https://unigpt.vip/
这个项目是一个 AI 聚合站,提供多模型,多场景的 AI 服务,目的是想学习 SEO,但是没能跳出舒适区。
在这个项目主要的工作除了开发,还有运营和推广,但感觉太卷,而且自己不擅长,所以就搁置了。
技术栈:
前端:NextJs
后端:NextJs
数据库:MongoDB
LLM:OpenAI, Anthropic, Gemini, etc.
其他:Docker
实现效果如下图:

virtualifes.com - 我想长期做的 AI 永生项目
发布时间:2024.06
项目网址:https://virtualifes.com/
这是一个 AI 永生项目,计划实现角色记忆、角色声音、角色形象和说话风格的复刻。
已经实现 MVP 版本,但由于成本较高且没有成功的商业化,故暂且搁置。
技术栈:
前端:React
后端:Python
数据库:SQLite,Chroma
LLM:OpenAI
STT:Whisper
TTS:ElevenLabs
Voice Clone:ElevenLabs
其他:Docker
实现效果如下图:

thinkverse.co - 我远程做的 AI Math Tutor 项目
发布时间:2024.09
项目网址:https://thinkverse.co/
这是一个 AI 数学教育项目,也是我第一次远程参与美国公司的项目,主要负责全栈开发。
技术栈:
前端:Svelte
后端:Svelte
数据库:PostgreSQL
LLM:OpenAI
其他:Docker
实现效果如下图:

总结与展望
回顾我做过的 AI 项目,有完成品,也有未完成品,有做得好的,也有做得不好的。但一切都是值得的,因为我在不断求索,不断进步。
相比于微薄的收益,学到的知识和技能才是我最大的收获,比如:
在做 ChatGPT 套壳项目时,我学会了如何使用 Cloudflare 实现代理 API 请求,这在国内调用 OpenAI API 时非常有用。
在做 AI 健身项目时,我尝试了团队的建立和组织,这比一个人单打独斗要难得多,但收获也更多。
在参与 RealChar 项目时,我积累了充分的 AI 语音合成经验,包括 ElevenLabs 和 Whisper 的调用。
在做音缘 AI 音乐项目时,我学会了调用 Suno API 生成音乐,首次对接微信支付。
在做 unigpt.vip 项目时,我第一次设计实现积分系统,第一次成功对接 Stripe 支付,实现订阅制收费。
在做 virtualifes.com 项目时,我初次使用 GPU 训练 Bert-VITS2 模型,并成功部署到云端,降低了成本同时提高了质量。
在做 thinkverse.co 项目时,我积累了丰富的与美国公司远程工作的经验,包括全英文沟通、远程会议、办公协作等。
当然,我还有不少欠缺的地方,比如:
没有跳出舒适区,没有深入学习实践 SEO,运营推广等知识。
商业化能力不足,虽然尝试了参赛、融资,但没有一个自己的项目收益达到预期。
执行力不足,想的比较多,做的比较少,导致很多项目没有完成。
展望未来,我近期的计划应该是:
深入研究 browser-use + deepseek 等方案,实现浏览器 AI Agent。
重启 AI 健身项目,尝试更好的运作模式和商业化。
构建《独立开发者手册》,沉淀内容同时帮助更多独立开发者实现自己的项目。
路漫漫其修远兮,吾将上下而求索。
我的资料
我的个人博客:https://ifree.love/
我的个人简历:https://me.ifree.love/
我的项目主页:https://me.ifree.love/#projects
UniGPT 官网:https://unigpt.vip/
Virtualifes 官网:https://virtualifes.com/
