Okapi是基于ripgrep构建的新CLI工具,支持用户跨多个文件在上下文中查找并批量替换文本模式。该工具专为解决大规模数字化项目中的OCR错误(扫描错误)而开发,尤其适用于历史政府文档。它通过与文本编辑器集成,提供比简单正则替换更可控的校正功能。
背景
ripgrep是一款高性能命令行搜索工具,而OCR(光学字符识别)在数字化历史文档时经常产生称为'scannos'的错误。传统的正则表达式替换缺乏上下文感知能力,难以实现精确校正。
- 来源
- Lobsters
- 发布时间
- 2026年3月30日 15:14
- 评分
- 5.0 / 10