Thread Reader
madawei

madawei
@madawei2699

Mar 5, 2023
11 tweets
Twitter

#ChatGPT 昨天花了半天重温了李光耀先生的书:李光耀观天下,本来想自己写个读书小结,但这事 chatGPT 显然也可以做。于是用 gpt-index 这个库试了下,效果奇好。我导入的是英文版的 epub,然后用中文要求 chatGPT 总结或回答我的问题。由于我已经读了两遍了,不得不说,这个总结很到位。未来已来🤯

#chatGPT 把我博客的一篇中文文章(bmpi.dev/dev/renaissanc…)投喂了给它,问了几个问题,总结的都很到位,就感觉很聪明🤯不知道这个和 bingAI 相比哪个更聪明?我一直在 bingAI 的等待列表里,如果哪位大佬有 bingAI 可以对比下这两个结果的差异,不知道哪个更好一些?
#ChatGPT 导入五百多页的英文 PDF,最终抽取出 34 万的 Token,读 PDF 也毫无障碍。看起来作为一个读书智能助理已经没什么大问题了🤔
#ChatGPT 把整部西游记导入,最终产生了 178 万个 Token 🤯 整体感觉对中文的支持没有英文那么好,只能回答一些简单的问题。稍微复杂的比如孙悟空哭了几次?红孩儿的父亲是谁?这类问题就回答不出来,如果让它自由发挥,就开始胡言乱语了😂但中英文随意切换是很容易的,这点并不受语料和问题语言的限制
#ChatGPT 经过这么一番测试后我花了多少钱?gpt-index 这个库在上面的例子里我都用了两个模型:text-embedding-ada-002-v2 和 gpt-3.5-turbo-0301,前者一百万个 Token 是 0.4 刀,后者百万 Token 是 2 刀。所以今天我一共花了 2.5 刀。这成本不算低,适合做个人私有部署的小工具。
#ChatGPT 接上。可使用 gpt-index 将 text-embedding-ada-002-v2 生成的数据保存到本地,这样后续的费用就只有 gpt-3.5-turbo-0301 了,哪怕像西游记这种大部头,embedding 的费用也只有 0.4 刀,之后与 chatGPT 的交互传输的是向量化后的数字。但从账单看,也包含了输入的 Token,而且 prompt 也不小
#ChatGPT Newsletter 这些文章可以通过一个 proxy 把文章的核心内容用让 chatGPT 以中文的语言来总结下,这样读的效果应该能大幅度提升。有时间我得整一个工具出来试试。
#ChatGPT 虽然 gpt_index 可以导入 GitHub Repo,但千万不要随意尝试,刚才导入了 gpt_index 的代码库,五百多万个 Token,光 embedding 模型的费用就 2 刀了(存储到磁盘后就无需再次调用此模型了),生成了 124MB 的 index json 文件🤯 看起来这又是一个有趣的阅读开源代码的方式了,就是太烧钱了。
#ChatGPT 经过一番测试,发现用 gpt_index 读开源项目代码非常合适,适合探索类的代码阅读。如果你对一个开源项目的代码结构感觉无从下手,那与 chatGPT 一块阅读可能是非常快速的一种方式!唯一需要考虑的是代码规模,如果代码量非常多,那可能首次的 embedding 的费用要贵一些,可能需要几美元。
#ChatGPT 除了震惊还是🤯,这可能是未来读代码的神器!!!这种方式完全可以抽丝剥茧的去阅读一个大型项目的代码了,如果它有自动绘制图形的能力就完美了! 当然费用也感人,三天下来十刀没了😢
#ChatGPT 通过自定义 prompt 后,ChatGPT 可以帮我在线 review 我的博客文章了。看起来这水平比 Bing AI 要好一些了。如果对答案不满意,只需要调优 prompt 就行了。它甚至可以用 PlantUML 帮我的文章画技术图!!!🤯
madawei

madawei

@madawei2699
✍️ https://t.co/sC8q0dvZ25 Learn / Dev / Trade
Follow on Twitter
Missing some tweets in this thread? Or failed to load images or videos? You can try to .