这一期我们主要做的就是PDE转MD功能的实现,可以本地模型OCR或者接入此类型的API,不过还是推荐API,成本低实现方式快。
选择PDF OCR其实识别PDF的API并不多,我也试用过国内外很多家OCR厂商,只有Mistral AI效果最佳,所以我们今天要接入的就是mistral-ocr模型,可以轻松实现功能。
创建API keys我们登录Mistral AI管理中心,点击API keys区域,再点击Crerta new key来创建key,key只会显示一次切记要保存哦~
既然已经选择mistral-ocr API,我们直接让Cursor来接入吧!
接入速度倒是挺快的,接入成功后在.env.local添加前面获取的key值。
我们来尝试功能看看是否可用?一开始就报错,没办法只能把终端报错继续投喂回去让它修改。
报错修改了两次还是有问题,直接投喂官方文档,让它根据官方文档来修复问题。
根据官方文档修改后还是会有报错,我们复制浏览器控制台的报错让它找到问题自动修复。
最后来回拉扯了不下于10次终于解决问题成功接入API咯~
不管是任何功能让AI来新增或解决BUG大概率都不会一次通过,出现问题不要紧,直接把报错投喂给它,它会自动修复。
当然并不是无厘头的投喂,总结我之前的经验,有问题先投喂官方文档,再出现报错可以浏览器控制台报错,终端报错都投喂给它,这样解决的速度相对来说会快点。
现在功能已经初步实现,感兴趣的可以观看我们下一期视频哦~