一站式AI速查表2025/8

一站式AI速查表 v5.2 | 從模型、技術到AI Agent

一站式AI速查表

從模型、技術到AI Agent,一份持續更新的權威指南。

第一部分:AI知識體系詳解

理解人工智慧需要一個清晰的層次結構。從最廣泛的AI概念到具體的演算法,它們之間是層層包含的關係:AI ⊃ 機器學習 ⊃ 神經網路 ⊃ 深度學習。

人工智慧 (Artificial Intelligence)

最廣泛的領域,旨在創造能夠模擬、延伸人類智慧的機器或系統。它涵蓋了所有使機器能夠思考、學習和解決問題的方法與理論。

機器學習 (Machine Learning)

實現AI的主要途徑。它並非對所有規則進行硬編碼,而是讓演算法從資料中自動學習模式與規律。所有深度學習都是機器學習,但並非所有機器學習都是深度學習。

經典機器學習演算法:

決策樹 (Decision Tree) K-均值 (K-Means)

神經網路 (Neural Network)

機器學習中的一個重要分支,其結構受人腦神經元的啟發,由相互連接的節點層組成,用於識別資料中的複雜關係。

MLP (多層感知器)

深度學習 (Deep Learning)

神經網路的子領域,特指使用具有許多層(「深度」)的神經網路。深度結構使其能夠學習極其複雜的抽象特徵,是當前AI突破的核心驅動力。

CNN (卷積神經網路) RNN (循環神經網路) LSTM (長短期記憶網路)

生成式AI (Generative AI)

AI的一個應用領域,專注於創造全新、原創的內容。現代生成式AI主要由大型、深度的神經網路(特別是Transformer架構)驅動,因此它與深度學習緊密相關。

語言模型 (Language Model) GAN (生成對抗網路)

第二部分:AI核心模型與技術

十五大關鍵AI模型

1. GPT系列 (OpenAI): 生成式預訓練Transformer,以強大的自然語言理解和生成能力聞名。
2. Gemini (Google): Google開發的多模態模型,能原生理解和處理文本、圖像、音訊和影片。
3. Llama系列 (Meta): Meta開源的大型語言模型,推動了開源社群的快速發展。
4. Claude系列 (Anthropic): 專注於AI安全和「憲法AI」,以長文本處理和謹慎回答著稱。
5. Stable Diffusion (Stability AI): 開源的文生圖擴散模型,以其靈活性和龐大的社群生態聞名。
6. Midjourney: 商業文生圖模型,以其卓越的藝術風格和圖像品質聞名。
7. Sora (OpenAI): 先進的文生影片模型,能夠生成高度逼真和富有想像力的影片片段。
8. BERT (Google): 雙向Transformer編碼器,革新了搜尋引擎和自然語言理解任務。
9. DALL-E系列 (OpenAI): GPT架構在圖像生成領域的應用,能夠根據文本描述創造出多樣化的圖像。
10. Grok (xAI): 能夠即時存取X平台資訊,以幽默和叛逆風格回答問題。
11. Mistral Large (Mistral AI): 歐洲領先的高性能模型,在推理能力上與頂級模型競爭。
12. Command R+ (Cohere): 專為企業級應用設計,在RAG和工具使用方面表現卓越。
13. Phi-3 (Microsoft): 高效能的「小型語言模型」(SLM),專為端側設備和低成本應用優化。
14. Kimi (月之暗面): 以超長上下文視窗(200萬字)處理能力聞名的中國領先模型。
15. AlphaFold (DeepMind): 在蛋白質結構預測領域取得革命性突破,極大加速了生命科學研究。

十五大提示工程技術

1. Zero-shot Prompting: 直接向模型提問,不提供任何範例。
2. Few-shot Prompting: 在提問前提供少量範例,引導模型理解任務。
3. Chain-of-Thought (CoT): 引導模型逐步思考,將複雜問題分解為多個步驟來回答。
4. Self-Consistency: 多次使用CoT生成多個答案,然後選擇最一致的結果。
5. Role Prompting: 要求模型扮演特定角色(如專家、老師)來回答問題。
6. Generated Knowledge: 先讓模型生成相關知識,再利用這些知識來回答原始問題。
7. ReAct (Reason and Act): 讓模型結合推理和行動,能調用外部工具(如搜尋引擎)來輔助回答。
8. Tree of Thoughts (ToT): 允許模型探索多個推理路徑,並評估它們以找到最佳解。
9. RAG (Retrieval-Augmented Generation): 在提示中加入從外部知識庫檢索到的即時資訊。
10. EmotionPrompt: 在提示中加入情感激勵的語句(如「這對我的職涯很重要」)以提升表現。
11. APE (Automatic Prompt Engineer): 利用LLM本身來自動生成和優化解決問題的提示。
12. Step-Back Prompting: 引導模型先思考問題背後的抽象概念或原則,再解決具體問題。
13. Metacognitive Prompting: 讓模型對自己的初步答案進行自我批判和修正,從而提高品質。
14. Contrastive CoT: 同時提供正確和錯誤的推理範例,讓模型學習避免常見錯誤。
15. ART (Automatic Reasoning and Tool-use): 讓模型自動學習如何使用新的外部工具來解決問題。

第三部分:AI商業應用場景

AI正全面滲透商業活動的各個環節,從提升效率到創造全新價值,其應用潛力無遠弗屆。

市場行銷1. 個性化廣告文案生成
2. 社群媒體內容創作
3. SEO關鍵字策略優化
4. 市場趨勢分析報告
5. A/B測試文案自動生成
客戶服務6. 24/7智慧客服機器人
7. 客戶郵件自動回覆
8. 語音客服即時轉錄與分析
9. 客戶情緒分析
10. 常見問題(FAQ)自動生成
營運管理11. 會議內容自動摘要
12. 內部文件智慧搜尋
13. 商業合約草擬與審查
14. 供應鏈風險預測
15. 員工培訓資料生成
產品開發16. 程式碼生成與除錯
17. 軟體文件自動撰寫
18. UI/UX設計原型生成
19. 產品需求文檔(PRD)撰寫
20. 合成資料生成以供測試

第四部分:實用工具與行業先鋒

第五部分:結構化提示框架實用指南

學習如何構建精確、高效的提示,釋放AI的全部潛力。使用結構化框架能顯著提升AI輸出的品質和穩定性。

RASCEF

Role, Action, Steps, Context, Examples, Format

如何使用:

這是一個非常全面的框架,適用於需要詳細指令的複雜任務。依次定義AI的角色、需要執行的主要行動、完成任務的具體步驟、相關背景資訊、一兩個參考範例,以及最終的輸出格式。

角色: 你是一位資深市場分析師。
行動: 分析提供的用戶數據,撰寫一份市場趨勢報告。
步驟: 1. 識別主要用戶群體。 2. 分析他們的購買行為。 3. 總結三個核心市場趨勢。
背景: 數據來自我們公司第三季度的電商銷售紀錄。
範例: 類似於我們上一季的報告,重點分析Z世代的消費潛力。
格式: 一份不超過500字的摘要,包含三個要點和一個總結圖表建議。

CLEAR

Context, Logic, Examples, Action, Refinements

如何使用:

適用於需要AI進行推理和迭代的任務。提供背景,解釋你的推理邏輯,給出範例,明確指出行動,並要求AI對結果進行自我修正或提煉。

背景: 我正在為一個新的健身App撰寫歡迎郵件。
邏輯: 郵件應該簡短、激勵人心,並包含一個明確的行動號召。
範例: 「歡迎加入!準備好開始你的蛻變之旅了嗎?點擊這裡完成你的第一個挑戰!」
行動: 撰寫三種不同風格的歡迎郵件。
提煉: 檢查郵件的語氣,確保它聽起來充滿活力而不是咄咄逼人。

ERA

Expectation, Role, Action

如何使用:

一個簡潔有力的框架,適用於快速定義任務。首先說明你的期望,然後賦予AI一個角色,最後下達具體的行動指令。

期望: 我需要一段吸引人的社群媒體貼文。
角色: 扮演一位美食部落客。
行動: 為一張巧克力蛋糕的照片寫一段100字以內的描述,包含表情符號。

PACT

Purpose, Audience, Context, Tone

如何使用:

專為寫作任務設計,用於精準控制內容風格。明確寫作的目的,定義目標受眾,提供相關背景,並指定所需的語氣。

目的: 說服員工參加即將舉行的團隊建設活動。
受眾: 公司全體員工,包括工程師和銷售人員。
背景: 活動將於下週五在戶外舉行。
語氣: 友好、熱情且專業。

RTF

Role, Task, Format

如何使用:

另一個快速高效的框架,強調輸出格式。指定AI的角色,描述任務,並明確要求結果的呈現格式。

角色: 你是一位經驗豐富的專案經理。
任務: 根據以下會議記錄,列出三個關鍵的後續行動項目。
格式: 使用項目符號列表。

第六部分:AI新紀元 – 智慧代理 (AI Agent)

AI Agent是能夠自主感知環境、制定計畫、並使用工具來達成複雜目標的系統,代表著AI從被動應答到主動執行的重要演進。

AI Agent的核心能力

規劃 (Planning)

將複雜目標分解為可執行的步驟。

工具使用 (Tool Use)

調用API、程式碼或資料庫來執行動作。

記憶 (Memory)

儲存和檢索短期與長期資訊以指導行動。

自我反思 (Self-Reflection)

評估自身行動成效並進行修正改善。

八種主流AI Agent架構

1. ReAct框架: 結合推理(Reason)和行動(Act),讓Agent在思考後決定下一步是使用工具還是回答。
2. 角色扮演Agent: 為Agent設定特定角色(如「行銷專家」),使其行為和決策符合該角色身份。
3. 規劃-執行Agent: 先制定一個完整的行動計畫,然後嚴格按照計畫順序執行,適合目標明確的任務。
4. 開放式結局Agent: 沒有明確終點,持續與環境互動、學習和適應,如終身學習型AI。
5. 階層式Agent: 由一個「主管」Agent將大任務分解,分配給多個「員工」Agent協同完成。
6. 多Agent系統: 多個獨立的Agent在一個共享環境中互動、合作或競爭,模擬複雜系統。
7. 語言Agent: 專注於透過自然語言與使用者和其他Agent進行複雜的溝通和協商。
8. 反思型Agent: 在行動後會進行「事後檢討」,總結經驗教訓以優化未來的決策。

十大AI Agent工具與框架

核心開發框架
1. LangChain: 最流行的Agent開發框架,提供模組化工具鏈來構建複雜應用。
2. LlamaIndex: 專注於將LLM與外部數據連接,是構建RAG和數據Agent的利器。
自主Agent平台
3. AutoGPT: 最早的自主Agent實驗之一,能自動產生並執行達成目標所需的每一步。
4. CrewAI: 專為協調多個角色扮演Agent協同工作而設計的框架。
多Agent模擬系統
5. ChatDev: 模擬一個軟體開發公司,讓多個Agent扮演不同角色(CEO, Coder)來完成開發任務。
6. MetaGPT: 將標準化作業流程(SOPs)編碼到多Agent系統中,提高協作效率。
專用工具與服務
7. Tavily AI: 為Agent設計的優化搜尋API,提供精準、即時的資訊。
8. Open Interpreter: 讓LLM能在本地安全地執行程式碼(Python, JS等),賦予Agent強大的執行能力。
9. Firecrawl: 將任何網站轉化為Agent可用的乾淨數據,專為爬取和數據抓取設計。
10. LangGraph: LangChain的擴展,用於構建具有循環和狀態的、更可靠的Agent。

第七部分:15個關鍵AI術語

大型語言模型 (LLM): 在海量文本上訓練的超大規模神經網路。
生成式AI (Generative AI): 能夠創造全新、原創內容的AI技術。
幻覺 (Hallucination): AI模型生成看似合理但事實錯誤的資訊。
Transformer: 基於自注意力機制的深度學習架構,現代LLM的基礎。
向量嵌入 (Vector Embedding): 將複雜資料轉換為機器可計算的數值向量。
提示工程 (Prompt Engineering): 設計輸入以引導AI產生期望輸出的藝術。
多模態 (Multimodality): AI能同時理解和處理多種資訊類型(如文本、圖像)。
微調 (Fine-tuning): 在預訓練模型基礎上,用特定領域資料進行二次訓練以適應任務。
擴散模型 (Diffusion Model): 一種生成模型,透過從雜訊中逐步還原資料來生成高品質圖像。
強化學習 (RL): 讓AI透過與環境互動、試錯和獎勵來學習最佳策略。
神經網路 (Neural Network): 模仿生物大腦結構的計算模型,是深度學習的核心。
API (應用程式介面): 允許不同軟體之間互相溝通和交換資料的橋樑。
開源 (Open Source): 原始碼公開,允許任何人檢視、修改和分發的軟體。
參數 (Parameters): 神經網路中透過學習調整的數值,代表模型的「知識」。
上下文視窗 (Context Window): 模型在生成下一個詞時能「看到」的前文長度。

一站式AI速查表 v5.2

一份持續更新、力求全面的AI知識指南。

Loading