跳到主要內容

GPT3 API 當中,你可能沒注意到的 ChatML

GPT-3 API 就這樣悄悄的來了!

是的, GPT-3 是一種由OpenAI提供的語言模型,它可以通過API接口使用。

以下是使用GPT-3 API的基本步驟:

  1. 註冊OpenAI帳戶:請訪問OpenAI網站(https://beta.openai.com/signup/),並創建一個帳戶。一旦註冊成功,您就可以訪問OpenAI的API密鑰。

  2. 訂閱GPT-3 API:在OpenAI中,您需要訂閱GPT-3 API,以便可以使用它。訂閱後,您可以獲取API密鑰。

  3. 安裝API軟件開發套件(SDK):您可以在Python、Node.js、Ruby、Java和其他語言中使用OpenAI API。您需要安裝相應的SDK,以便使用它。

  4. 獲取API密鑰:在獲取API密鑰後,您可以將其保存在環境變數中,或直接將其添加到代碼中。

  5. 連接到API:使用SDK中提供的函數和類,您可以連接到GPT-3 API。

  6. 發送請求:一旦您已連接到GPT-3 API,您可以通過向API發送HTTP請求來使用GPT-3模型。

當然我們也不是只講這種大家都知道的幹話,上述這些 chatgpt 都可生出來給你, 以下為重點,再次感謝您可以閱讀到這邊 ...本文開始



ChatML

這次 GPT3 API 的釋出,除了這件事情之外,另外還有 ChatML 以及 fine-tuning 這兩個對於自己來說是個大重點。

ChatML 的釋出,讓我們可以使用 api 像是使用 chatgpt 讓整體上下文開始有了連貫,其中官方也有提供完整的描述。

https://github.com/openai/openai-python/blob/main/chatml.md

在這段過程裡面在 OpenAI 的GPT API中,message 中的 role 指定了對話中發言的角色,可以是 system、user、assistant中的任何一個,具體的差異如下:

system:表示對話接下來這段對話的背景,角色分配,情境。

user:表示用戶輸入的信息。這可以是文字輸入內容。

assistant:表示對話系統助手生成的訊息,可以是對前一輪對話的回應、應用程式特定的提示或任何其他形式的輸出。

這些角色的目的是區分不同的訊息類型,以幫助GPT模型更好地理解上下文和對話的流程,從而生成更有意義的回應。

範例程式碼如下,

import openai
openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
        {"role": "system", "content": "你將扮演我的貼身小助手."},
        {"role": "assistant", "content": "非常榮幸成為您的貼身小助手,請問有什麼需要我協助的事情嗎?"},
        {"role": "user", "content": "誰是世界籃球之王?"},
        {"role": "assistant", "content": "普遍認為NBA的迈克尔·乔丹(Michael Jordan)是史上最偉大的籃球運動員之一,他曾贏得6次NBA總冠軍、5次NBA最有價值球員獎、10次NBA得分王等眾多榮譽,並被譽為「空中飛人」"},
        {"role": "user", "content": "籃球之王的媽媽是誰?"}
    ]
)

根據這樣的上下文,我們就能夠得到 德洛丽丝·乔丹(Deloris Jordan) 這個回應,這顯然是上下文起到很大的作用,對吧!

省還能夠省

根據上述大家可以發現 ChatML 的模式,的確可以很精確地將上下文進行貫穿,但同時也大幅度的增加了 token 的數量

然而勤儉持家的我們,可以先透過 chatgpt 先將模擬的對話進行演練,輸出結果當然會有些許落差。

然而,透過這其中對話的過程,都可以先透過 playground 或者 chatgpt 裡面事先演練過,並不一定都需要透過 chat-api 實際執行。

勤儉持家是美德

然而,這邊有發現,其中的內文是可以偷雞的,可以將冗詞刪除,例如,

『非常榮幸成為您的貼身小助手,請問有什麼需要我協助的事情嗎?』

就可以縮減為

『我已成為您的貼身小助手』

將這樣的 content 縮減置換後,發現兩者所產生的結果會是相近的,

其中有幾個遊戲規則,

  1. 身為 system 可以簡化,
  2. 身為 user 問題可以簡化,
  3. 身為 assistant 簡要回應至關鍵連結點即可。

至於可以偷雞到什麼程度,這中間需要玩家自行判斷。

減少 token ,就是降低 cost, 雖然 gpt3 model 價格已經比 davinci 還便宜很多,但勤儉持家就是美德,同胞們請繼續保持。

題外話及結語

很多時候我們會以為整個討論是有全文貫穿,但實際思考下來,並非如此,真正需要貫穿的過程,可能就是那 3-5 個來回而已,其他對談的過程其實都已經開了新的題目。

當然全部結果塞進去 messages ,結果很棒,很開心,但無奈荷包不允許。

對於領台幣的我們,能夠勤儉持家是個美德,共勉之,有任何回饋歡迎留言給我,或者按讚訂閱分享,多謝,感謝!

留言

這個網誌中的熱門文章

面試者如何挑戰大工程師時代來臨?

面試者如何挑戰大工程師時代來臨? 全世界都在倡導轉職成為工程師,似乎轉職成為工程師就成為職場的救贖,真的是如此嗎?讓老衲來杠給各位聽。 最近有位好久不見的小朋友,是 2000 年出生的小蔡,對於即將面臨到面對職場的挑戰開始關心起技術,他開始尋找比較適合自己的領域,同時也開始在思考到底為了接下來的就職小蔡該如何準備。 詢問我說是不是可以考慮軟體開發工程師這條路線 對於他的詢問,反而引起我的注意, 這讓我開始思考並映射於最近招募的經驗,軟體開發此領域是不是對於每個人都是可以擔任的職啀,這邊分享一些自己的看法希望對各位有所幫助。 全民工程師這件事情 在全球景氣低迷的狀況下,的確特別在這一年大家會很有感覺萬物齊漲,薪水不漲,薪資就是一直停滯不前。 很多時候,在不同的領域中,會發現整個薪資就算是擔任了管理職務主管你也會面臨到薪資的強大屏障在自己面前。 這個時候, 軟體工程師年薪百萬口號 似乎就成了一種救贖。 好像成為了工程師就可以達到年薪百萬,在家輕鬆工作,不用打卡也不用受到風吹雨淋,隨時想工作就可以工作,每個月又有固定薪水入帳,感受到類財富自由,人生的美好。 如果能夠爭取到跨國公司的職位,這份薪水有可能還可以上看每個月十多萬以上,甚至是往上也是極度有可能的事情,人生美好層次又再度提高了起來。 但這件事情是真的每個人都可以達到嗎? 還是這就是另外一種性存者偏差呢? 亦或者這些人其實是金字塔頂端的小眾? 每份履歷都像是同一種履歷 最近在最近幾年在面試工程師的時候特別會看到許多轉職者,一開始履歷裡面看到相關的作品一開始會覺得十分的驚艷, Wow, 現在的新手就可以做到如此精美的畫面,這些畫面是我當初用 Bootstrap 也做不出來的東西,許多的互動體驗好的一個不行,做出來的頁面配色和對齊也是極致。 但是隨著時間推移,多看了幾封履歷之後,就會發現在各大技術養成學院出來的學生履歷成果內容如出一轍,在面試的過程中也會詢問許多關於框架的底層概念,和比較技術觀念的時候,甚至是許多框架的核心概念,就很容易露出馬腳。 很多面試者會 一問三不知 ,透過許多引導,但殘酷的是連關鍵字是什麼都也無法推敲出來,更不用說在小組裡面到底怎麼樣合作,許多不同線上產品的比較,使用者流程,使用者後面的互動邏輯等,幾乎是風吹一片倒,只能

jQuery, animate function with css exlapenation.

Today, I want to use jQuery making a animation for webpage, First I check animate fuction on ref book. I clearly know how use it, there are two main function for animate. 1. $().animate({ "style1":"value1" , "style2":"value2" }, Time); Time: it can be three type, String => "slow", "fast", "normal". Integer=>10000 2. $().stop(); it can immedaitely stop animation. Let's do some experieces, I bulit a simple page. You can hover UP and DOWN for a article sliding UP or DOWN. Les't do it. HTML CODE: <div id="all"> <div id="up">往上</div> <div id="showTab"> <div id="data"> About This script is intended for forms where the user needs to upload an image to a Web site. The image is displayed on the page for previewing before uploading. The display will be resized if needed so as not to break the page layout. Valid file types are set in the scri

初探 LangChain:語言模型應用程式開發的強大框架

LangChain 是一個強大的框架,致力於幫助開發人員利用語言模型構建端到端的應用程式。它提供了一整套工具、組件和接口,大大簡化了創建由大型語言模型(LLM)和聊天模型支持的應用程式的過程。LangChain 可以輕鬆地管理與語言模型的互動,將多個組件連接在一起,並集成額外的資源,例如 API 和資料庫。 LangChain https://python.langchain.com/en/latest/index.html 不說廢話,直接開始試著安裝, pip install langchain pip install openai export OPENAI_API_KEY="..." 以下是一些 LangChain 的簡單程式碼: import os os.environ["OPENAI_API_KEY"] = "..." from langchain.llms import OpenAI from langchain import OpenAI, ConversationChain from langchain.agents import initialize_agent from langchain.agents import load_tools from langchain.chains import LLMChain from langchain.prompts import PromptTemplate prompt = PromptTemplate( input_variables=["product"], template="What is a good name for a company that makes {product}?", ) print(prompt.format(product="colorful socks")) # What is a good name for a company that makes colorful socks? 在 LangChain 中,開發人員可以使用 LLM、Chat Model、Agents、Chains、Memory