日本語コーディング性能が最も高いローカルLLMモデルは何か？MGSMベンチを実施して考察した

概要 gemma3,qwq等々、24GB程度のVRAMで動き、かつ性能が高いとされるローカルLLMモデルがどんどん出てきています。それぞれ、英語や多言語のベンチマークをそれぞれ出してきて我こそが最高性能だ！って言いあっているわけですが、私がLLMに求めているものは…

Cline(RooCode)を使えば3時間でollamaのwebクライアントができた（合計30ドル）

概要 Roo Code(Sonnet3.7)を使って簡易的なollamaクライアントアプリを作ったので、作成の流れと費用、設計にあたって感じたポイントを共有していきます。今回は、RooCodeに指示を出すだけで全くコードを書かずに、たった3時間で公開までこぎつけられました…

概要つくばチャレンジ2024を完走した際の実装内容は以下記事にまとめましたが、gpt-4oのVLMを用いて障害物回避判定を行う部分については、少し新規性があるかなと思うので、本記事で少し詳しくまとめました。今回の実装で自律走行というリアルタイム性の高…

はじめにロボットが遊歩道環境を2ｋｍ程度走行する走行コンテストに個人サークル、週末組2024として参加し、完走＆信号認識課題を達成したので、実装内容について共有します。自己開発した部分はさほど多くなく、かつシンプルな実装となっているため、他の…

ローカルLLM

概要以下の記事にて、GPU2枚で40GBのVRAMを搭載したPCを構築しましたが、GPU1枚から2枚に分散することによってどれほど速度が落ちるのかを評価してみました。結論としては許容範囲内の速度低下だったので一安心。詳細は下をご確認ください。モデル一つでの…