A community-driven registry for Claude, Cursor, Windsurf, Cline & more. Not affiliated with Anthropic.
Are you the author? Sign in to claim
大型語言模型(LLM)的讀書會內容code部分整理,此github提供簡單、免費、易實作code範例,並由淺入深帶你一步步了解如何基於python建置LLM流程、部屬功能等
✍️ 作者: 鄭永誠 • ✉️ 信箱 • 🧑🤝🧑 合作夥伴: 紫式大數據決策 • 👫 我的朋朋: Morale AI
內容簡介:
這個分享內容宗旨:
範例使用版本/輔助工具:
主要資料來源: 💻 資料來源1: 偉大的Github 🤗 資料來源2: 偉大的抱抱臉 👨 巨人的肩膀: LLM相關工具大整理
(因分享會有搭配我的簡報才會以這個架構講述,實際上這些課程無直接連貫性!!!)
(這些皆以前讀書會簡報內容,恕此處跳過)
💡本章節讓你從0開始,讓你了解AI到底是啥、LLM基礎原理到底是怎麼運作的, 以及了解踏入LLM這塊領域時你必須了解的相關的名詞和知識
| 主題 | 簡介 | 類別 | Notebook | Resource |
|---|---|---|---|---|
| I1-人工智慧簡介與發展近況 | 什麼是AI? 發展學派與歷史脈絡 | 基礎課程 | 見讀書會ppt | |
| I2-機器學習基本概念 | 機器/深度學習最最最白話版基礎概念 | 基礎課程 | 見讀書會ppt | |
| I3-LLM基礎原理 | Token, Embedding, Transformer...等基礎 | 基礎課程 | 見讀書會ppt | |
| I4-LLM相關知識 | 提示工程、RAG與LLM框架、Fine-tuned,模型超參數 | 基礎課程 | 見讀書會ppt | |
| I5-實踐工具 | LangFlow / Flowise 快速實踐工作流程 | 延伸補充 | flowise | langflow |
| I6-簡易部屬 | 內部使用OpenWeb UI / Anything LLM部屬 | 延伸補充 | 見讀書會ppt | OpenWebUI |
💡本章節你將了解LLM的基礎使用和部署概念, 從如何使用LLM、如何建立簡單介面展示、建立流程並管控這些流程等 並補充一些RAG和fine-tuned的先備知識
| 主題 | 簡介 | 類別 | Notebook |
|---|---|---|---|
| C0-前置作業與基礎工具 | 建立虛擬環境、基礎python輔助工具 | 前置準備 | C0 |
| C1-簡單使用範例 | Groq操作、程式實踐基礎問答 | 基礎課程 | C1 |
| C2-立刻部屬簡易系統 | Gradio快速實踐系統介面、即時對話系統 | 基礎課程 | C2 |
| C3-已結合LLM的一些開源工具 | 一些AI工具如open-interpreter,Scrapegraph-ai... | 額外分享 | C3 |
| C4-進階RAG操作 | Reranker概念和效果 | 延伸補充 | C4 |
| C5-實踐LLM服務Agent流程-1 | 基於Langchain架構下的LangGraph實踐 | 進階課程 | C5 |
| C6-實踐LLM服務Agent流程-2 | 基於Langchain架構下的LangGraph實踐 | 進階課程 | C6 |
| C7-將Agent流程進行管控 | 使用langsmith來管理、更清楚瞭解建立的流程 | 進階課程 | C7 |
| C8-fine-tuned簡易操作範例 | 使用Unsloth簡易實踐qLora fine tuned(只放程式碼、不實際運行) | 進階課程 | C8 |

💡 本章節你將學會更進一步的資料處理流程, 最終完整流程(Data Ingestion)可能包含:
Loaders ➡️ 允許與外部源集成以上傳信息
transormers ➡️ 各種資料處理流程,如 parse (轉換), split to chunk(分割), extract(擷取), embedding(向量化)... 等多種流程
Vector Stores ➡️ 將資訊存入向量資料庫
Retrievers ➡️ 建立用於信息檢索的組件,從大規模文本數據集中檢索相關信息,即實踐RAG
LLM Agent / Tools ➡️ 各個處理問題的Agent、LLM模型或各種工具
Memories ➡️ 可能會有記錄對話的需求,特別當你建立的是對話式的LLM應用時
Output Parsers ➡️ 把結果轉換成需求的格式,常見如json, md...
| 主題 | 簡介 | 類別 | Note |
|---|---|---|---|
| C9-文本資料處理基礎 | 文檔spit, parse, extract等概念和建立pipeline | 基礎課程 | C9 |
| C10-文本處理流程概念 | 接續C9,資料處理、Ingestion Pipeline與RAG routing | 基礎課程 | |
| C11-向量資料庫建置與各功能 | chroma, weaviate, pinecone... | 基礎課程 | |
| C12-常見其他流程框架 | 流程框架如DSPy介紹 | 額外分享 | |
| C13-其他資料庫結構 | 知識圖譜與GraphRAG | 延伸補充 |
| 主題 | 簡介 | 類別 | Note |
|---|---|---|---|
| C13-NeMo Curator | NVIDIA NeMo 生態系統相關介紹 | https://github.com/NVIDIA/NeMo-Curator |




C0: 可略過
C1: Langchain, Groq, llama_index
C2: Gradio
C3: 可略過
C4: Sentence-transformer, Reranker (with Jina)
C5: Langchain, LangGraph
C6: Langchain, LangGraph
C7: LangSmith
C8: Unsloth
C9: llama_index
C12: DSPy
接下來就請去各ipynb筆記上去了解如何操作吧 ~
COZE (以前免費常用...但現在QQ): 快速部屬LLM服務、Agent、建立dicord bot、設計workflow等,介面很舒服
perplexity: 目前(2024.7)用起來最順的LLM輔助網頁搜尋工具
claude 3.5 sonnet: 目前(2024.7)覺得code表現能力最棒的LLM,特別是他的Artifacts功能
寫程式一定要Copilot Github 或是嘗試近期(2024.7)熱門的 Cursor,後者我雖沒在用,但都很推
Hugging Face, Github;甚至是 GAI年會、臉書社團, iT 邦幫忙, Medium 文章等資源
李宏毅 – 生成式導論2024 (YT)
李宏毅 – 【機器學習 2023】(生成式 AI) (YT)
李宏毅 – 【機器學習 2022 】(YT)
陳縕儂 – 深度學習應用、人工智慧導論 (YT)
諸多YT上資源
LLM資源彙總 (github)
如有問題,歡迎用各種方法直接聯繫我,或在GitHub Issue中提交喔~
版權所有© 2024 鄭永誠 YC-Cheng (Jason)。保留所有權力。
Pocket Flow: Codebase to Tutorial
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
💻 A curated list of papers and resources for multi-modal Graphical User Interface (GUI) agents.
npx CLI installing 100+ agents, commands, hooks, and integrations in one command