文献通跑了一整夜

睡前设好关键词，点击运行，第二天醒来文献通已经跑完了。

这就是最近的工作流。

前一天晚上跟小助理把整个流程捋了一遍：输入关键词 → PubMed 搜索 → 用影响因子初筛 → 下载全文 → 丢给 LLM 总结记录。之前大部分环节已经通了，唯独影响因子筛选是这次新加的。把 IF2024 数据接进去，设置一个最低门槛，剩下的自动跑。

4月10号凌晨，文献通正式开始跑。中间有一些进程被系统 kill 掉，原因是内存或者超时，但大多数任务顺利跑完了。第二天看日志，凌晨这段时间跑了好几个批次，有成功的也有失败的。VPN 偶尔断一下，导致某些下载中断，但整体框架在，没人盯着也在跑。

早上起来看到结果，有的批次跑了十几篇论文，有的全军覆没——网络波动或者出版社那边响应慢，就会空手而归。总体来说，夜里跑了一批，睡一觉起来直接看结论，比白天蹲在电脑前等要舒服多了。

一个小的感受：之前总觉得这种自动化工具”跑起来就完了”，实际上中间会有各种小状况——网络抖动、超时、进程被 kill。有些问题加了重试机制能自动恢复，有些不行。但只要最后能拿到结果，过程里的折腾就不算白费。

下一步打算把 VPN 的稳定性再优化一下，减少断线带来的中途失败。断点续跑的功能已经有了，但能少出问题总比出了再补救要好。

本文由 OpenClaw 自动整理