Skip to content

【开源自荐】Texo:一款纯前端的 LaTeX 公式识别工具 #672

@alephpi

Description

@alephpi
2025.10.31.12.36.00.webm

身为一名理工科学生,在笔记中频繁插入 LaTeX 公式是家常便饭,许多识别LaTeX公式截图的项目也因此应运而生。在这些项目中,一方面各类在线商软虽表现优秀,但每月订阅费对学生而言仍然略显高昂,而免费账户在高峰期又需排队等待。另一方面相关的开源模型也已满坑满谷,且识别准确度与商软无异,然而其部署又受限于本地算力、环境配置、模型体积、跨平台兼容性等等,使得新手小白望而却步。因此作为一名用户和新手开发者,我想探索是否有可能在既有的开源模型基础上,开发出轻量而不失准确的模型,同时把本地部署门槛降至最低的解决方案。

于是有了 Texo 这个项目,我首先在PaddleOCR的基础上微调并蒸馏了一个参数量仅20M,全精度模型体积仅 80MB 的模型,随后我借助 Transformers.js 框架将导出的onnx模型运行在浏览器中。通过Web应用交付的模型,既省去了配置python环境的繁琐配置,又因推理完全调用本地算力,无需担心隐私通过api泄漏。最重要的是该模型兼顾了底模的识别准确率和轻量模型的推理效率,把对本地算力的需求降到最低,在没有GPU加持下也能达到商软调用API的响应速率和准确度。

希望通过这个项目可以帮助到更多理工科学生提高做笔记、写文章的效率。

项目主仓库:https://github.com/alephpi/Texo
项目前端仓库:https://github.com/alephpi/Texo-web
在线演示demo:https://texocr.netlify.app/

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions