Deus Blog

如何透過 Key-Value Paired CSV 建立 RAG資料集？

August 26, 2024 No Comments

所謂的 Key-Value paired CSV 在我們系統中指的是有明確定義 CSV檔案標頭欄位名稱且沒有巢狀結構（ex. cell 沒有分割或合併）的 CSV檔案，有明確定義欄位名稱與其對應的數值，系統在剖析檔案內容時會更加的精準。

如何校正 RAG後的資料集 | 操作教學

August 22, 2024 No Comments

點選 RAG 選單進入 RAG 資料及列表，並選定要進行校正的資料集。在已檢索的資料及列表中點選要校正資料的語料片段。點選要校正的語料區塊後會展開一個選單，然後編修要校正的資料。資料編修完後點擊『Update chunk』，更新後的數據就可以寫入 Vector Store完成語料的更新。

Agent 的建立流程以及模型選擇 | 操作教學

August 9, 2024 No Comments

這個介面是專門用來管理你的 AI Agent 的工具。在這裡，你可以看到所有已建立的 Agent，了解它們的名稱、類型（例如 Chatbot）、當前狀態（像是是否啟用），以及建立時間。你可以利用這個介面新增 Agent、編輯設定或管理它們的狀態。此外，你還可以使用搜尋功能來快速找到你需要的 Agent，方便你更有效地掌握和控制所有的 LLM Agent。

OpenAI 的 Structured Outputs 與 `gpt-4o-2024-08-06` 模型

August 7, 2024 No Comments

OpenAI推出結構化輸出功能，確保模型輸出完全符合開發者提供的JSON結構定義。新模型gpt-4o-2024-08-06性能大幅提升，同時降低了使用成本。該功能支援多種模型，包括GPT-4和GPT-3.5系列，適用於Chat completion、Assistant和Batch API。OpenAI採用了特殊訓練和約束解碼技術，提高了輸出的可靠性。此功能還支援視覺輸入，為多模態應用開闢了新的可能性。然而，使用時需注意某些限制，如資料類型限制和初次處理延遲等。

從零開始申請 OpenAI API Key | 操作教學

July 19, 2024 No Comments

這篇文章提供了從零開始申請 OpenAI API Key 的詳細教學。主要步驟包括註冊OpenAI帳號、驗證電子郵件、登錄並訪問API Keys頁面，創建新的API Key並保存。文章強調保存API Key的重要性，避免洩露並在必要時生成新的API Key。詳細教學步驟和注意事項請見原文。

How to do “Prompt Engineering” right in 2024

June 19, 2024 No Comments

提示（Prompt）是生成型AI模型的輸入，用於引導其輸出，可包括文本、圖片、聲音等媒體。Prompt Template是含變量的函數，用於生成具體提示。提示的主要組成部分包括指令（核心意圖）、範例（輔助AI完成任務的示範）、輸出格式指定和風格指示。這些元素共同作用，使提示能夠有效地引導AI完成各種任務，如文本生成、圖像描述和音頻總結等。提示的設計對於獲得準確、相關的AI輸出至關重要。

Python virtual environment with “pyenv” on Ubuntu

June 1, 2024 No Comments

What is “pyenv”? pyenv is a popular tool used to manage multiple versions of Python on a single machine. It allows you to easily switch between different Python versions and manage project-specific Python environments. This can be particularly useful for developers who need to test their code across different Python versions or maintain projects that

新時代的基礎建設研究：NVIDIA

February 25, 2024 No Comments

前幾天『NVIDIA』發佈財報之後市值整個暴漲 3,000 億美元，創下美股單日最高市值漲幅。因為本身就打算長期投入人工智慧的領域做深耕，所以多少都有部署些資金在我口中的新時代基建上，我今天就想透過這篇簡短的文章來理清一下為何我認為 NVIDIA 這家公司砸長期上值得我們持續關注，不管你是否要買入，一樣的，我這絕對絕對不是投資建議，大家當做是一篇我如何透過 NVIDIA 去一窺 AI 未來 5~10 年發展可能的一篇筆記文就好。

關於 LLM 我只是略懂：Gemma 筆記

February 22, 2024 No Comments

Gemma 是一系列輕量級、先進的開放大語言模型，建立於與創造 Gemini 模型相同的研究和技術之上。由『Google DeepMind』和Google 其他團隊開發，Gemma 靈感來自 Gemini，名字反映了拉丁文 gemma 的意思，即「寶石」。除了模型權重外，Google 也發布了工具來支持開發者創新、促進合作，並指導如何負責任的使用 Gemma 模型。

如何用 GTM + GA4 實作 YouTube 影片觀看數據追蹤

February 20, 2024 No Comments

文章介紹如何使用Google Tag Manager (GTM)和Google Analytics 4 (GA4)來追蹤YouTube影片的觀看數據。文中提到，若使用YouTube block嵌入影片，事件無法被GTM觸發；而使用Custom HTML block並在URL上添加enablejsapi=1參數，則可成功觸發事件。詳細步驟包括在GTM中配置觸發器和標籤，並在GA4中查看和分析相關數據。此方法可使YouTube影片追蹤更精確和有效。更多詳情請見原文。

來自 YC 對人類文明發展下一階段的使命召喚

February 20, 2024 No Comments

本篇的內容來自 YC 今年夏季招募新創團隊的 RFS，我挑選了我很感興趣的領域，不感興趣或跟我專業差太遠的我就只把他們列出來而已，像是『新的防禦技術』、『將製造業帶回美國』、『新的太空公司』、『氣候技術』、『穩定幣金融』以及『終結癌症的方法』等等就跟我們現階段團隊技能組成幾乎完全沒相關，至於其他的幾項我都會沿著脈絡去探索我們公司的機會點在哪裡，我最後會就我目前最愛且最相關的那五個方向做深度的研究。

LLMOps 的探索之路（序章）

February 20, 2024 No Comments

LLMOps（Large Language Model Operations）是一個涵蓋了大型語言模型（如 OpenAI 的 GPT 系列、Google 的 PaLM 以及眾多如 Meta 的 LLaMa 這樣的開源 LLMs）開發、部署、維護和優化的一整套實作的方法論和資料管理流程。LLMOps 的存在目標是確保讓開發者甚至一般使用者能夠高效能、高擴展性且安全地使用這些強大的 AI 模型來建構和營運能夠解決使用者問題的應用程式。整個架構牽涉到 #模型訓練、#微調、#RAG、部署、監控、版本控制、更新、安全性、可協作性、可轉移性以及合規性等各個面向。

Insights & Innovations

Start typing and press enter to search