PaddleOCR：全球领先 OCR 工具包与文档 AI 引擎完全指南

TextMatrix 发布于 2026-04-01 收录于技术笔记

PaddleOCR：全球领先 OCR 工具包与文档 AI 引擎完全指南

§1 学习目标

完成本文档后，你将能够：

✅ 理解 PaddleOCR 的定位与设计理念
✅ 掌握 PaddleOCR 的核心功能与使用方法
✅ 部署和配置 PaddleOCR 开发环境
✅ 使用 PP-OCR 系列进行文本识别
✅ 使用 PaddleOCR-VL 进行文档智能解析
✅ 使用 PP-StructureV3 进行文档结构化
✅ 优化推理性能和生产部署
✅ 集成到 RAG 和 Agent 应用

§2 项目概述

2.1 什么是 PaddleOCR？

PaddleOCR（GitHub 仓库）是百度飞桨团队开发的全球领先 OCR 工具包与文档 AI 引擎，可将 PDF 文档和图像转换为结构化的、LLM 可用的数据（JSON/Markdown），具有行业领先的准确率。

ChatDev 2.0 (DevAll)：零代码多智能体开发平台完全指南

TextMatrix 发布于 2026-04-01 收录于技术笔记

ChatDev 2.0 (DevAll)：零代码多智能体开发平台完全指南

§1 学习目标

完成本文档后，你将能够：

✅ 理解 ChatDev 2.0 的定位与设计理念
✅ 掌握 ChatDev 2.0 的核心功能与使用方法
✅ 部署和配置 ChatDev 2.0 开发环境
✅ 使用 Web 控制台设计和管理工作流
✅ 使用 Python SDK 编程执行工作流
✅ 集成 OpenClaw 实现高级自动化
✅ 扩展和自定义 ChatDev 2.0

§2 项目概述

2.1 什么是 ChatDev 2.0 (DevAll)？

ChatDev 2.0 (DevAll)（GitHub 仓库）是由 OpenBMB 团队开发的零代码多智能体平台，旨在实现"Developing Everything"——通过简单的配置快速构建和执行定制的多智能体系统。

TaxHacker：自托管 AI 会计应用完全指南

TextMatrix 发布于 2026-04-01 收录于技术笔记

TaxHacker：自托管 AI 会计应用完全指南

§1 学习目标

完成本文档后，你将能够：

✅ 理解 TaxHacker 的定位与设计理念
✅ 掌握 TaxHacker 的核心功能与使用方法
✅ 部署和配置 TaxHacker 自托管实例
✅ 配置 AI 提供商（OpenAI/Gemini/Mistral）
✅ 自定义分类、项目和字段
✅ 导出税务报告和数据
✅ 进行本地开发

§2 项目概述

2.1 什么是 TaxHacker？

TaxHacker（GitHub 仓库）是一款自托管的 AI 会计应用，专为自由职业者、独立开发者（indie hackers）和小型企业设计，利用现代 AI 技术自动化费用和收入跟踪。

Dimillian/Skills：Apple 平台智能体技能集合完全指南

TextMatrix 发布于 2026-04-01 收录于技术笔记

Dimillian/Skills：Apple 平台智能体技能集合完全指南

§1 学习目标

完成本文档后，你将能够：

✅ 理解 Dimillian/Skills 的定位与设计理念
✅ 掌握 16 个核心技能的功能与用途
✅ 安装与配置 Dimillian/Skills
✅ 在 Codex 环境中使用各类技能
✅ 根据项目需求选择合适的技能
✅ 为团队创建自定义技能

§2 项目概述

2.1 什么是 Dimillian/Skills？

Dimillian/Skills（GitHub 仓库）是由开发者 Dimillian 创建的可复用开发技能集合，专门针对 Apple 平台开发、GitHub 工作流、重构、代码审查和 bug 调查等场景。

Agent Lightning：微软 AI 智能体强化学习训练框架完全指南

TextMatrix 发布于 2026-04-01 收录于技术笔记

Agent Lightning：微软 AI 智能体强化学习训练框架完全指南

§1 学习目标

完成本文档后，你将能够：

✅ 理解 Agent Lightning 的核心定位与设计理念
✅ 掌握 Agent Lightning 的安装与基本使用方法
✅ 理解 Agent Lightning 的架构设计与 LightningStore 原理
✅ 使用 Agent Lightning 训练任意框架的智能体
✅ 配置强化学习、自动提示优化、监督微调等算法
✅ 利用轨迹级聚合（TLA）加速训练
✅ 构建生产级别的智能体训练流程

§2 项目概述

2.1 什么是 Agent Lightning？

Agent Lightning（GitHub 仓库）是微软研究院开发的 AI 智能体训练框架，核心理念是「The absolute trainer to light up AI agents」。

Trae Agent：字节跳动 LLM 智能体完全指南

TextMatrix 发布于 2026-04-01 收录于技术笔记

Trae Agent：字节跳动 LLM 智能体完全指南

§1 学习目标

完成本文档后，你将能够：

✅ 理解 Trae Agent 的核心定位与研究导向设计理念
✅ 掌握 Trae Agent 的安装与配置方法
✅ 理解 Trae Agent 的架构设计与模块化思想
✅ 使用 Trae Agent 执行各类软件工程任务
✅ 配置多种 LLM 提供商（OpenAI/Anthropic/Doubao等）
✅ 使用交互模式和 Docker 模式
✅ 利用轨迹录制进行调试和分析

§2 项目概述

2.1 什么是 Trae Agent？

Trae Agent（GitHub 仓库）是字节跳动开发的基于 LLM 的智能体，专为通用软件工程任务设计。