November 2023

Take a break and read all about it

Meta AI 相關專案

Seamless 筆者一句話以概之:#翻譯蒟蒻 結案! Meta 提出的 Seamless model 能夠實現 end-to-end 的表達性多語言翻譯,並支持串流的處理方式。其中一項重要貢獻是改進後的 SeamlessM4T v2 模型,該模型基於更新的 #UnitY2 框架,並增加了對低資源(low-resource)語言的訓練。#SeamlessAlign 的擴展增加了大量自動對齊數據,支持高達 76 種語言。 模型的關鍵特性 性能評估 這裡的「適應性協議(Adapted Protocols)」可能包括以下幾個方面 理論上 Meta 透過這些適應性協議進行的人類評估,有助於更全面地理解和改進這些先進的自動語音翻譯系統,確保它們不僅在技術層面上先進,也在實際使用中達到人類使用者的期望和需求。

Read More »

關於 NVIDIA NeMo Guardrails 我只是略懂(一)

在去年十一月 ChatGPT 出現在我眼前之後,第一個想法就是 LLMs 勢必將會快速的掃除 Chatbot 這樣一個應用領域在過去遇到的許多問題,毫無意外的,聊天機器人現在嚴然是最多開發者實踐 LLMs 的 downstream task。根據 Gartner 的一些報告,他們預期到 2027 年,聊天機器人將成為所有組織中 25% 的主要溝通渠道。 這種採用速度相當驚人,但也存在危險。聊天機器人可以非常有說服力地杜撰事實,而要像對真人一樣給聊天機器人設置指引也更加的困難。所以,如果你客服渠道後面部署了一群真人客服,他們會受過關於如何談論你的公司、不該說什麼、應該說什麼以及要禮貌等各方面的培訓。但對於 LLM-based 的聊天機器人來說在實務上是一件相當困難的事情,實作過你就會清楚的知道開發出一個 ChatGPT 的體驗跟直接與 OpenAI 的 API

Read More »

網路上大神們關於創業想法的一些雜記

作為一名 #不成功連續創業者,我最近無意間看到一段 Peter Thiel 的短影片,影片中 Peter Thiel 分享了他對於「Complex Coordination」在商業世界中的重要性及其被普遍低估的見解。在這個快速變化的創業環境中,我們常常問自己:『這家公司能否成為市場上的獨角獸?』Thiel 提供了一些有趣的想法。 他強調了幾個可以使公司成為市場領導者的關鍵要素。例如,Twitter 之所以成功,是因為它在一個極簡的產品上實現了迅速的擴散。而在企業級 SaaS 這樣的領域,不斷的技術創新和穩步改進是關鍵。當然,像 #比特幣 這樣的創新也是打破傳統格局的一個範例。 然而,Thiel 特別強調了「複雜協調」的重要性,這一概念在創造壟斷力量的路上經常被忽視。這個概念與精實創業的思維有所不同,它更注重於如何將眾多零散的部分協調結合,創造出全新的價值。正如蘋果公司在過去十年里通過iPhone的成功所證明的那樣,創新並非總是關於全新的單一元素,而更多是關於將現有元素以獨特的方式結合起來,創造出難以複製的產品。 他還以特斯拉和 SpaceX 為例,指出它們成功的關鍵也在於複雜的協調。特斯拉的創新不在於單個組件的新穎性,而在於如何將這些組件融合,重塑整個分銷網絡。這種複雜的協調不僅是技術上的挑戰,還涉及到一種 Lost art of accounting:精確地計算成本並將它們有效地結合。Elon

Read More »

關於 Andrej Karpathy 的 Intro to Large Language Models 的一些筆記

這幾天真的是非常的忙,總算在週末時騰出了些時間來看看 Andrej Karpathy 近期非常火的一段 YouTube,如果說他之前在微軟的活動上所進行的那場 State of GPT 是一場對開發者講述什麼是 LLM 的經典演說的話,那他這一次這段時長一小時的分享影片就是一場面向一般大眾介紹什麼是 LLM 的經典。 一個小時的內容全部都是非技術介紹,涵蓋了 #模型推理、#模型訓練、#模型微調 以及 LLM 的發展趨勢,以及安全挑戰。影片的內容非常的新,基本上還有涵蓋到了近一個月在 LLMs 上的相關發展,有些關於 LLMs 的觀念與知識我也是因為看了這次的分享才知道,同時也釐清了一些我對 LLMs 原本不甚瞭解的地方。 Andrej

Read More »

關於 Claude 2.1 我只是略懂

主要的亮點 API Tools API Tools 使用是 Claude 2.1 的一個新beta功能,它允許 Claude 整合到用戶現有的流程、產品和 API 中。這意味著 Claude 不僅僅是一個獨立的 AI model,而是可以成為用戶現有工作流程的一部分,從而提高日常操作的效率和效果。 擴展互操作性:透過這個功能,Claude 允許開發者撰寫 #自定義函數、API、搜尋網際網路來源,並從 Private Knowledge Base 中檢索資料做 RAG。這意味著

Read More »