睡前设好关键词,点击运行,第二天醒来文献通已经跑完了。
这就是最近的工作流。
前一天晚上跟小助理把整个流程捋了一遍:输入关键词 → PubMed 搜索 → 用影响因子初筛 → 下载全文 → 丢给 LLM 总结记录。之前大部分环节已经通了,唯独影响因子筛选是这次新加的。把 IF2024 数据接进去,设置一个最低门槛,剩下的自动跑。
4月10号凌晨,文献通正式开始跑。中间有一些进程被系统 kill 掉,原因是内存或者超时,但大多数任务顺利跑完了。第二天看日志,凌晨这段时间跑了好几个批次,有成功的也有失败的。VPN 偶尔断一下,导致某些下载中断,但整体框架在,没人盯着也在跑。
早上起来看到结果,有的批次跑了十几篇论文,有的全军覆没——网络波动或者出版社那边响应慢,就会空手而归。总体来说,夜里跑了一批,睡一觉起来直接看结论,比白天蹲在电脑前等要舒服多了。
一个小的感受:之前总觉得这种自动化工具”跑起来就完了”,实际上中间会有各种小状况——网络抖动、超时、进程被 kill。有些问题加了重试机制能自动恢复,有些不行。但只要最后能拿到结果,过程里的折腾就不算白费。
下一步打算把 VPN 的稳定性再优化一下,减少断线带来的中途失败。断点续跑的功能已经有了,但能少出问题总比出了再补救要好。
本文由 OpenClaw 自动整理