T E X T M A T R I X

PaddleOCR:全球领先 OCR 工具包与文档 AI 引擎完全指南

PaddleOCR:全球领先 OCR 工具包与文档 AI 引擎完全指南

§1 学习目标

完成本文档后,你将能够:

  • ✅ 理解 PaddleOCR 的定位与设计理念
  • ✅ 掌握 PaddleOCR 的核心功能与使用方法
  • ✅ 部署和配置 PaddleOCR 开发环境
  • ✅ 使用 PP-OCR 系列进行文本识别
  • ✅ 使用 PaddleOCR-VL 进行文档智能解析
  • ✅ 使用 PP-StructureV3 进行文档结构化
  • ✅ 优化推理性能和生产部署
  • ✅ 集成到 RAG 和 Agent 应用

§2 项目概述

2.1 什么是 PaddleOCR?

PaddleOCRGitHub 仓库)是百度飞桨团队开发的全球领先 OCR 工具包与文档 AI 引擎,可将 PDF 文档和图像转换为结构化的、LLM 可用的数据(JSON/Markdown),具有行业领先的准确率。

ChatDev 2.0 (DevAll):零代码多智能体开发平台完全指南

ChatDev 2.0 (DevAll):零代码多智能体开发平台完全指南

§1 学习目标

完成本文档后,你将能够:

  • ✅ 理解 ChatDev 2.0 的定位与设计理念
  • ✅ 掌握 ChatDev 2.0 的核心功能与使用方法
  • ✅ 部署和配置 ChatDev 2.0 开发环境
  • ✅ 使用 Web 控制台设计和管理工作流
  • ✅ 使用 Python SDK 编程执行工作流
  • ✅ 集成 OpenClaw 实现高级自动化
  • ✅ 扩展和自定义 ChatDev 2.0

§2 项目概述

2.1 什么是 ChatDev 2.0 (DevAll)?

ChatDev 2.0 (DevAll)GitHub 仓库)是由 OpenBMB 团队开发的零代码多智能体平台,旨在实现"Developing Everything"——通过简单的配置快速构建和执行定制的多智能体系统。

TaxHacker:自托管 AI 会计应用完全指南

TaxHacker:自托管 AI 会计应用完全指南

§1 学习目标

完成本文档后,你将能够:

  • ✅ 理解 TaxHacker 的定位与设计理念
  • ✅ 掌握 TaxHacker 的核心功能与使用方法
  • ✅ 部署和配置 TaxHacker 自托管实例
  • ✅ 配置 AI 提供商(OpenAI/Gemini/Mistral)
  • ✅ 自定义分类、项目和字段
  • ✅ 导出税务报告和数据
  • ✅ 进行本地开发

§2 项目概述

2.1 什么是 TaxHacker?

TaxHackerGitHub 仓库)是一款自托管的 AI 会计应用,专为自由职业者、独立开发者(indie hackers)和小型企业设计,利用现代 AI 技术自动化费用和收入跟踪。

Dimillian/Skills:Apple 平台智能体技能集合完全指南

Dimillian/Skills:Apple 平台智能体技能集合完全指南

§1 学习目标

完成本文档后,你将能够:

  • ✅ 理解 Dimillian/Skills 的定位与设计理念
  • ✅ 掌握 16 个核心技能的功能与用途
  • ✅ 安装与配置 Dimillian/Skills
  • ✅ 在 Codex 环境中使用各类技能
  • ✅ 根据项目需求选择合适的技能
  • ✅ 为团队创建自定义技能

§2 项目概述

2.1 什么是 Dimillian/Skills?

Dimillian/SkillsGitHub 仓库)是由开发者 Dimillian 创建的可复用开发技能集合,专门针对 Apple 平台开发、GitHub 工作流、重构、代码审查和 bug 调查等场景。

Agent Lightning:微软 AI 智能体强化学习训练框架完全指南

Agent Lightning:微软 AI 智能体强化学习训练框架完全指南

§1 学习目标

完成本文档后,你将能够:

  • ✅ 理解 Agent Lightning 的核心定位与设计理念
  • ✅ 掌握 Agent Lightning 的安装与基本使用方法
  • ✅ 理解 Agent Lightning 的架构设计与 LightningStore 原理
  • ✅ 使用 Agent Lightning 训练任意框架的智能体
  • ✅ 配置强化学习、自动提示优化、监督微调等算法
  • ✅ 利用轨迹级聚合(TLA)加速训练
  • ✅ 构建生产级别的智能体训练流程

§2 项目概述

2.1 什么是 Agent Lightning?

Agent LightningGitHub 仓库)是微软研究院开发的 AI 智能体训练框架,核心理念是「The absolute trainer to light up AI agents」。

Trae Agent:字节跳动 LLM 智能体完全指南

Trae Agent:字节跳动 LLM 智能体完全指南

§1 学习目标

完成本文档后,你将能够:

  • ✅ 理解 Trae Agent 的核心定位与研究导向设计理念
  • ✅ 掌握 Trae Agent 的安装与配置方法
  • ✅ 理解 Trae Agent 的架构设计与模块化思想
  • ✅ 使用 Trae Agent 执行各类软件工程任务
  • ✅ 配置多种 LLM 提供商(OpenAI/Anthropic/Doubao等)
  • ✅ 使用交互模式和 Docker 模式
  • ✅ 利用轨迹录制进行调试和分析

§2 项目概述

2.1 什么是 Trae Agent?

Trae AgentGitHub 仓库)是字节跳动开发的基于 LLM 的智能体,专为通用软件工程任务设计。