Insights & Innovations

Dive into our curated collection of articles, where we explore the latest trends, breakthroughs, and best practices in the world of Large Language Models and NLP. Stay informed, inspired, and ahead of the curve with our expert insights

OpenAI 的 Structured Outputs 與 `gpt-4o-2024-08-06` 模型

OpenAI推出結構化輸出功能,確保模型輸出完全符合開發者提供的JSON結構定義。新模型gpt-4o-2024-08-06性能大幅提升,同時降低了使用成本。該功能支援多種模型,包括GPT-4和GPT-3.5系列,適用於Chat completion、Assistant和Batch API。OpenAI採用了特殊訓練和約束解碼技術,提高了輸出的可靠性。此功能還支援視覺輸入,為多模態應用開闢了新的可能性。然而,使用時需注意某些限制,如資料類型限制和初次處理延遲等。

Read More »

從零開始申請 OpenAI API Key | 操作教學

這篇文章提供了從零開始申請 OpenAI API Key 的詳細教學。主要步驟包括註冊OpenAI帳號、驗證電子郵件、登錄並訪問API Keys頁面,創建新的API Key並保存。文章強調保存API Key的重要性,避免洩露並在必要時生成新的API Key。詳細教學步驟和注意事項請見原文。

Read More »

How to do “Prompt Engineering” right in 2024

提示(Prompt)是生成型AI模型的輸入,用於引導其輸出,可包括文本、圖片、聲音等媒體。Prompt Template是含變量的函數,用於生成具體提示。提示的主要組成部分包括指令(核心意圖)、範例(輔助AI完成任務的示範)、輸出格式指定和風格指示。這些元素共同作用,使提示能夠有效地引導AI完成各種任務,如文本生成、圖像描述和音頻總結等。提示的設計對於獲得準確、相關的AI輸出至關重要。

Read More »

Python virtual environment with “pyenv” on Ubuntu

What is “pyenv”? pyenv is a popular tool used to manage multiple versions of Python on a single machine. It allows you to easily switch between different Python versions and manage project-specific Python environments. This can be particularly useful for developers who need to test their code across different Python versions or maintain projects that

Read More »

新時代的基礎建設研究:NVIDIA

前幾天『NVIDIA』發佈財報之後市值整個暴漲 3,000 億美元,創下美股單日最高市值漲幅。因為本身就打算長期投入人工智慧的領域做深耕,所以多少都有部署些資金在我口中的新時代基建上,我今天就想透過這篇簡短的文章來理清一下為何我認為 NVIDIA 這家公司砸長期上值得我們持續關注,不管你是否要買入,一樣的,我這絕對絕對不是投資建議,大家當做是一篇我如何透過 NVIDIA 去一窺 AI 未來 5~10 年發展可能的一篇筆記文就好。

Read More »

關於 LLM 我只是略懂:Gemma 筆記

Gemma 是一系列輕量級、先進的開放大語言模型,建立於與創造 Gemini 模型相同的研究和技術之上。由『Google DeepMind』和Google 其他團隊開發,Gemma 靈感來自 Gemini,名字反映了拉丁文 gemma 的意思,即「寶石」。除了模型權重外,Google 也發布了工具來支持開發者創新、促進合作,並指導如何負責任的使用 Gemma 模型。

Read More »

如何用 GTM + GA4 實作 YouTube 影片觀看數據追蹤

文章介紹如何使用Google Tag Manager (GTM)和Google Analytics 4 (GA4)來追蹤YouTube影片的觀看數據。文中提到,若使用YouTube block嵌入影片,事件無法被GTM觸發;而使用Custom HTML block並在URL上添加enablejsapi=1參數,則可成功觸發事件。詳細步驟包括在GTM中配置觸發器和標籤,並在GA4中查看和分析相關數據。此方法可使YouTube影片追蹤更精確和有效。更多詳情請見原文。

Read More »

來自 YC 對人類文明發展下一階段的使命召喚

本篇的內容來自 YC 今年夏季招募新創團隊的 RFS,我挑選了我很感興趣的領域,不感興趣或跟我專業差太遠的我就只把他們列出來而已,像是『新的防禦技術』、『將製造業帶回美國』、『新的太空公司』、『氣候技術』、『穩定幣金融』以及『終結癌症的方法』等等就跟我們現階段團隊技能組成幾乎完全沒相關,至於其他的幾項我都會沿著脈絡去探索我們公司的機會點在哪裡,我最後會就我目前最愛且最相關的那五個方向做深度的研究。

Read More »

LLMOps 的探索之路(序章)

LLMOps(Large Language Model Operations)是一個涵蓋了大型語言模型(如 OpenAI 的 GPT 系列、Google 的 PaLM 以及眾多如 Meta 的 LLaMa 這樣的開源 LLMs)開發、部署、維護和優化的一整套實作的方法論和資料管理流程。LLMOps 的存在目標是確保讓開發者甚至一般使用者能夠高效能、高擴展性且安全地使用這些強大的 AI 模型來建構和營運能夠解決使用者問題的應用程式。整個架構牽涉到 #模型訓練、#微調、#RAG、部署、監控、版本控制、更新、安全性、可協作性、可轉移性以及合規性等各個面向。

Read More »

AI 御三家的最新動態(2024年2/15 updated)

農曆年之前,AI 領域『御三家』最為人們所關注的題材在於各家擁有的三神器:Gemini Ultra、GPT-5 與 Llama-3。但出乎所有人意料的是,單就在 2/15 這一天,御三家不約而同的都直接領域展開『無量空處』直接癱瘓了一大批新創。

Read More »

關於 OpenAI Sora 我依舊只是略懂

Sora 是一種由『資料驅動的物理引擎』,其底層是一個端到端的 Diffusion Transformer Model,它可以直接將文字或圖片輸入轉化成影片像素輸出。通過對大量影片數據的梯度下降學習,Sora 在神經網絡的參數中隱性的學習到了一個物理引擎該有的運作方式。

Read More »

當你將 AI 從你的募資簡報中移除後,你的護城河是什麼?

通過有效的品牌定位和創新的市場策略,即便是在一個充滿同質化產品的市場中,也能創造出顯著的市場價值和用戶認同。對於 AI 新創來說,這意味著創辦人思維高度必須要著需要超越技術本身,深入挖掘使用者需求(特定利基市場)和市場趨勢,並通過獨特的品牌故事和用戶體驗來吸引和留住用戶。

Read More »