プロフィール
<< 2024年12月 >>
1
2 3 4 5 6 7
8
9 10 11 12 13 14
22
23 24 25 26 27 28
29
30 31
リンク集
カテゴリアーカイブ
月別アーカイブ
2024年12月 (25)
2024年11月 (59)
2024年10月 (64)
2024年09月 (62)
2024年08月 (71)
2024年07月 (61)
2024年06月 (67)
2024年05月 (71)
2024年04月 (72)
2024年03月 (61)
2024年02月 (63)
2024年01月 (73)
2023年12月 (33)
2023年11月 (43)
2023年10月 (30)
2023年09月 (33)
2023年08月 (48)
2023年07月 (52)
2023年06月 (67)
2023年05月 (72)
2023年04月 (80)
2023年03月 (108)
2023年02月 (63)
2023年01月 (17)
2022年12月 (14)
2022年11月 (24)
2022年10月 (43)
2022年09月 (33)
2022年08月 (44)
2022年07月 (15)
2022年06月 (6)
2021年12月 (1)
2021年11月 (49)
2021年10月 (60)
2021年09月 (54)
2021年08月 (54)
2021年07月 (56)
2021年06月 (50)
2021年05月 (62)
2021年04月 (44)
2021年03月 (53)
2021年02月 (48)
2021年01月 (60)
2020年12月 (51)
2020年11月 (61)
2020年10月 (54)
2020年09月 (54)
2020年08月 (60)
2020年07月 (49)
2020年06月 (48)
2020年05月 (61)
2020年04月 (48)
2020年03月 (58)
2020年02月 (31)
2020年01月 (55)
2019年12月 (54)
2019年11月 (53)
2019年10月 (54)
2019年09月 (60)
2019年08月 (54)
2019年07月 (49)
2019年06月 (63)
2019年05月 (52)
2019年04月 (55)
2019年03月 (61)
2019年02月 (49)
2019年01月 (54)
2018年12月 (50)
2018年11月 (52)
2018年10月 (55)
2018年09月 (65)
2018年08月 (48)
2018年07月 (55)
2018年06月 (56)
2018年05月 (50)
2018年04月 (57)
2018年03月 (58)
2018年02月 (51)
2018年01月 (64)
2017年12月 (53)
2017年11月 (56)
2017年10月 (61)
2017年09月 (59)
2017年08月 (65)
2017年07月 (84)
2017年06月 (57)
2017年05月 (69)
2017年04月 (76)
2017年03月 (69)
2017年02月 (72)
2017年01月 (212)
2016年12月 (236)
2016年11月 (166)
2016年10月 (239)
2016年09月 (365)
2016年08月 (222)
2016年07月 (82)
2016年06月 (56)
2016年05月 (71)
2016年04月 (69)
最新記事

2023年05月13日

Capabilities -- Exams(丸山先生のBlog要約)

ChatGPT

GPT4.0は、人間向けの試験問題を解く能力を示しました。具体的なプロンプトは公開されていませんが、美術史のAP試験のサンプルは提供されています。言語の文法性・構成性によって語の並びが関連づけられるため、Next Word Predictionは比較的容易です。しかし、文と文の関係は論理的含意や共通の感情の流れなど別の原理によって機能します。Attentionメカニズムは、文や文書の間の意味の理解を支援する役割を果たします。GPT-4の能力の発揮には人間の知恵も関与している可能性があります。司法試験のプロンプトがGPT-4自体によって生成されたのかは不明です。

Bing AIの説明

“GPT-4 Technical Report” のCapabilitiesの章では、GPT-4がどのような能力を持っているかについて、様々なタスクやベンチマークで評価した結果を紹介しています。
前半部分では、以下の4つのタスクについて述べています。
・法律試験:GPT-4は、画像として与えられた法律試験の問題に対して、正しい回答とその根拠をテキストで生成することができました。GPT-4は、模擬試験で**90%**以上の正答率を達成し、受験者の上位10%に入るスコアを獲得しました。
・論文要約:GPT-4は、画像として与えられた論文のタイトルとアブストラクトに基づいて、その論文の主な貢献や結論をテキストで要約することができました。GPT-4は、人間の専門家による要約と比較して、高いROUGEスコアとBLEUスコアを達成しました。
・インターネットミーム:GPT-4は、画像として与えられたインターネットミームに対して、そのユーモアや意味をテキストで説明することができました。GPT-4は、人間の評価者によるランキングで、平均して3.8点(5点満点)を獲得しました。
・レシピ生成:GPT-4は、テキストとして与えられた料理名や材料に対して、その料理の作り方をテキストで生成することができました。GPT-4は、人間の評価者によるランキングで、平均して3.9点(5点満点)を獲得しました。

https://maruyama097.blogspot.com/2023/05/capabilities-exams.html





posted by 3chan at 17:37| (カテゴリなし)
Build a Mobile Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: