Claude 是一款目前免費使用的聊天式大型語言模型,在之前由 LMSYS 評選的聊天式大型語言模型排行榜中,僅次于排名榜首的 GPT-4,昨日(2023年7月11日)獨立發(fā)布 Claude 2,支持中文對話,不再依托 Slack,目前美國和英國的用戶已經(jīng)可以注冊使用了。@Appinn

什么是 LMSYS
大型模型系統(tǒng)組織 (LMSYS Org) 是一個開放的研究組織,由加州大學(xué)伯克利分校的學(xué)生和教師與加州大學(xué)圣地亞哥分校和卡耐基梅隆大學(xué)合作創(chuàng)立。排行榜地址在這里。
Claude 2
之前的 Claude 需要在 Slack 中使用,并且有個神奇的現(xiàn)象,部分用戶可免費使用,部分用戶需要付費 Slack 使用,部分用戶完全不能使用。
Claude 2 發(fā)布之初,基本上所有的美國和英國用戶都可以注冊使用。青小蛙嘮叨一句:注冊要趕早啊,誰知道明天是不是就不給注冊了。
注冊地址:https://claude.ai/ (目前僅限美國、英國用戶)

注冊過程中規(guī)中矩,支持 Email 注冊,以及 Google 登錄。
注意兩個免責(zé)條款:
- 有時可能會產(chǎn)生不正確或誤導(dǎo)性的信息,或產(chǎn)生攻擊性或有偏見的內(nèi)容。
- 本網(wǎng)站無意提供專業(yè)建議,包括法律、財務(wù)和醫(yī)療建議。請勿在未進(jìn)行獨立研究的情況下依賴克勞德。
最明顯的特色就是支持上傳文檔了:

支持一次上傳 5 個文檔、每個最大 10MB,支持 PDF、Docx、TXT、CSV、MD、ini 等很多格式,青小蛙覺得常見文本格式都支持,比如字幕文件 .srt 也可以的。
青小蛙拿出了 DEMO 文檔給 Claude 2 處理,結(jié)果滿意:

Claude 2 會根據(jù)對話內(nèi)容,自動幫你起一個名字,和 ChatGPT 一樣可以創(chuàng)建多個對話。首頁給了幾個例子:
- 用要點提綱概括此PDF文檔
- 幫助我練習(xí)西班牙語詞匯
- 解釋這個python游戲是如何工作的
至于聊天式大型語言模型到底怎么用,每個人都不一樣,比如青小蛙現(xiàn)在會讓 GPT 起標(biāo)題,但效果也是是好是壞。當(dāng)然最重要的,可能還是對用戶的訓(xùn)練,即如何更靠譜的提問。會提問才能用好 GPT ??
最后,來個范例,青小蛙使用的英國節(jié)點推薦。
原文:http://m.halvbo.cn/claude-2-release/
下面的內(nèi)容,是 Claude 2 發(fā)布頁面的內(nèi)容機(jī)翻:
我們很高興推出我們的新型號 Claude 2。 Claude 2 具有改進(jìn)的性能、更長的響應(yīng)時間,并且可以通過 API 以及面向公眾的新測試版網(wǎng)站 claude.ai 進(jìn)行訪問。我們從用戶那里聽說,克勞德很容易交談,清楚地解釋其思維,不太可能產(chǎn)生有害的輸出,并且具有更長的記憶力。我們在編碼、數(shù)學(xué)和推理方面對之前的模型進(jìn)行了改進(jìn)。例如,我們最新的模型在律師考試多項選擇部分的得分為 76.5%,高于 Claude 1.3 的 73.0%。與申請研究生院的大學(xué)生相比,Claude 2 在 GRE 閱讀和寫作考試中的得分高于 90%,在定量推理方面與申請者的中位數(shù)相似。
將克勞德視為一位友好、熱情的同事或私人助理,可以用自然語言指導(dǎo)來幫助您完成許多任務(wù)。面向企業(yè)的 Claude 2 API 的價格與 Claude 1.3 相同。此外,美國和英國的任何人今天都可以開始使用我們的測試版聊天體驗。
當(dāng)我們努力提高模型的性能和安全性時,我們增加了 Claude 輸入和輸出的長度。用戶可以在每個提示中輸入最多 100K 個令牌,這意味著 Claude 可以處理數(shù)百頁的技術(shù)文檔甚至一本書。克勞德現(xiàn)在還可以編寫更長的文檔 – 從備忘錄到信件再到故事,最多可達(dá)幾千個標(biāo)記 – 全部一次性完成。
此外,我們的最新模型大大提高了編碼技能。 Claude 2 在 Python 編碼測試 Codex HumanEval 上的得分比 56.0% 提高了 71.2%。在 GSM8k 這一大量小學(xué)數(shù)學(xué)題上,Claude 2 的得分從 85.2% 上升到 88.0%。我們?yōu)?Claude 2 制定了令人興奮的功能改進(jìn)路線圖,并將在未來幾個月內(nèi)緩慢、迭代地部署它們。
我們一直在迭代改進(jìn)克勞德 2 的底層安全性,使其更加無害,并且更難以提示產(chǎn)生攻擊性或危險的輸出。我們有一個內(nèi)部紅隊評估,使用自動化測試對我們的模型在大量有代表性的有害提示上進(jìn)行評分,同時我們還定期手動檢查結(jié)果。在此評估中,與 Claude 1.3 相比,Claude 2 在提供無害響應(yīng)方面的表現(xiàn)要好 2 倍。盡管沒有任何模型可以免受越獄的影響,但我們使用了各種安全技術(shù)(您可以在此處和此處閱讀相關(guān)內(nèi)容)以及廣泛的紅隊合作來提高其輸出。
Claude 2 為我們的聊天體驗提供動力,并且在美國和英國普遍可用。我們正在努力讓 Claude 在未來幾個月內(nèi)能夠在全球范圍內(nèi)提供更多服務(wù)。現(xiàn)在,您可以創(chuàng)建一個帳戶并開始用自然語言與 Claude 交談,請求其幫助完成您喜歡的任何任務(wù)。與人工智能助手交談可能需要一些嘗試和錯誤,因此請閱讀我們的提示,以充分利用 Claude。
我們目前還與數(shù)千家使用 Claude API 的企業(yè)合作。 Jasper 是我們的合作伙伴之一,它是一個生成式 AI 平臺,使個人和團(tuán)隊能夠擴(kuò)展其內(nèi)容策略。他們發(fā)現(xiàn),Claude 2 能夠在各種用例中與其他最先進(jìn)的模型并駕齊驅(qū),但在長格式低延遲用途方面具有特殊的優(yōu)勢。 “我們真的很高興成為第一批向客戶提供 Claude 2 的公司之一,它帶來了增強(qiáng)的語義、最新的知識培訓(xùn)、改進(jìn)的復(fù)雜提示推理,以及通過 3 倍大的上下文窗口輕松重新混合現(xiàn)有內(nèi)容的能力”,Jasper 工程副總裁 Greg Larson 說道。 “我們很自豪能夠通過與 Anthropic 的合作來幫助我們的客戶保持領(lǐng)先地位。”
Sourcegraph 是一個代碼 AI 平臺,幫助客戶編寫、修復(fù)和維護(hù)代碼。他們的編碼助手 Cody 使用 Claude 2 改進(jìn)的推理能力為用戶查詢提供更準(zhǔn)確的答案,同時還通過多達(dá) 100K 上下文窗口傳遞更多代碼庫上下文。此外,Claude 2 還接受了最新數(shù)據(jù)的訓(xùn)練,這意味著它擁有更新的框架和庫的知識,可供 Cody 從中提取。 Sourcegraph 首席執(zhí)行官兼聯(lián)合創(chuàng)始人 Quinn Slack 表示:“在人工智能編碼方面,開發(fā)人員需要快速、可靠地訪問有關(guān)其獨特代碼庫的上下文,以及具有大上下文窗口和強(qiáng)大通用推理能力的強(qiáng)大法學(xué)碩士。” “開發(fā)工作流程中最慢、最令人沮喪的部分正在變得更快、更愉快。感謝 Claude 2,Cody 幫助更多開發(fā)人員構(gòu)建更多推動世界前進(jìn)的軟件。”
我們歡迎您提供反饋,因為我們致力于更廣泛地負(fù)責(zé)任地部署我們的產(chǎn)品。我們的聊天體驗是公開測試版,用戶應(yīng)該意識到克勞德 – 像所有當(dāng)前模型一樣 – 可能會產(chǎn)生不適當(dāng)?shù)捻憫?yīng)。人工智能助手在日常情況下最有用,例如用于總結(jié)或組織信息,但不應(yīng)在涉及身心健康和福祉的情況下使用。如果您想在當(dāng)前不受支持的領(lǐng)域與 Claude 交談,或者您是一家企業(yè)并希望開始與 Claude 合作,請告訴我們。