换种思路训练gpt3.5

Ws3年前分什么类15699
  • 问题一

我用的是aws的免费服务器,centos,版本比较老旧,想在python3基础上运行openai,可惜怎么都装不了,openai提供的方法,使用pyenv来装,顺利解决。

curl https://pyenv.run | bash

然后配置下环境 ~/.bashrc 

export PATH="$HOME/.pyenv/bin:$PATH"
eval "$(pyenv init -)"
eval "$(pyenv virtualenv-init -)"

最后source ~/.bashrc 

开始安装python

pyenv install 3.9.0

如果系统存在更高的python版本,需要设置成你想要的版本号

pyenv global 3.9.0

也还有可能出现这个错误 The `python3' command exists in these Python versions:3.9.0

这个情况下,需要指定shell版本

pyenv shell 3.9.0


  • 问题二

urllib3的库只支持openssl 1.1.1+,奈何系统已经升级了最新版本的openssl,urllib还是报错,只能降级urllib3了

pip3 install urllib3==1.26.6


  • 问题三

openai的关联库sklearn,已安装的情况下,一直报错 ModuleNotFoundError: No module named 'sklearn'

解决方法:

pip install scikit-learn


问题都解决了,那开始进入正题,如何换思路呢?

前面这篇POST已经提到过了,finetunes不理想,我个人已经放弃训练这个3.0版本了,3.5有角色功能,system assistant  user,我直接从system角色入手,提前将匹配的答案存入system。实操是有明显效果的,只是会消耗更多的token。


开始,首先思路有了,怎么才能轻松地把匹配的答案找到呢,我们还是使用openai的工具:embeddings_utils,我们先将原县喂给finetunes的资料丢给embeddings,然后get_embedding出最佳答案,最后存入system,发送给api。效果挺好,就是费钱。

相关文章

AI周报2026-02

AI 模型 Claude(Anthropic) 核心结论:Claude 模型可在数秒内分析财务报表并生成投资备忘录。 补充完善:演示显示模型处理完整财务报表并快速输出结构化投资备忘录,突出高度自...

00后少年在自家客厅完成全基因组测序,成本从27亿降到1100美元

00后少年在自家客厅完成全基因组测序,成本从27亿降到1100美元

2003年,人类首次完成全基因组测序,耗时13年、花费27亿美元。2026年,一位00后少年在自家客厅餐桌上,用二手设备和AI模型完成了同样的工作——总成本约1100美元。 成本降低了245万倍。而...

AI开始自己赚钱了:Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

AI开始自己赚钱了:Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

2026年5月11日,AI圈的新闻开始呈现出一种全新的气质——AI不再只是被人类使用的工具,它开始自己赚钱、自己看病、自己打造教育内容了。 Cerebras IPO:20倍超额认购,AI芯片的资...

利用树莓派设置局域网代理

还有更方便的软路由就不介绍了,自己Google。正好有个闲置的树莓派,国外有个正在用的服务器。就给同事提供福利咯思路:在树莓派上安装v2ray客户端,然后同事们连接树莓派的代理就行了。1、树莓派安装v...

Anthropic 估值9000亿、OpenAI遭集体诉讼、Runway Agent发布:2026年5月14日AI日报

📈 Anthropic 估值突破 9000 亿,B2B 采用率首次超越 OpenAI Anthropic 正在以超过 9000 亿美元的投前估值筹集至少 300 亿美元,这有望成为该公司迄今最大规模...

mpvue vant 做个简单的核销小程序

我们公司业务一般偏营销,小程序的属性在营销这块没有那么明显,所以很少会有小程序的业务,这次也是帮朋友的忙,用mpvue+vant做了个简单的应用。应用不复杂,但是大部分的功能也都用到了,比如生成/扫描...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。