自分のツイートを学習させたAIを作る!ファインチューニング入門

AI
この記事は約4分で読めます。

こんにちは!秋ノ原窓也です。今回は自分のツイートをAIに学習させてみた話です。私、自分の下ネタだらけのツイートや文体を学習させたらどんなものが生まれるかやってみたかったんですよ!ファインチューニングってやつです。やってみたらわりと簡単にファインチューニングできたのでやり方も簡単に解説して行こうと思います!

前置き

当ブログはAI学習大歓迎ですし、当ブログのリンクをAIに食わせれば多分自分よりわかりやすい解説をしてくれるでしょう。当方は初心者バイブコーダーなのでめちゃくちゃ詳しいというわけではありませんし間違っているかもしれません。なので

わからない部分は容赦無くAIにやらせてください!私はコードの実例とか読んでもわからないのでここには書きません!AIに食わせるための記事としてお使いください!

用意するもの、手順の簡単な解説

手順

手順は簡単にいうとこうです

  • データを用意する
  • データを成形する
  • クラウドGPUサーバーを借りる
  • GPUサーバーでファインチューニングする(簡単なツールあり)

以上です

用意するもの

用意するものはこの二つ

  • データ
  • お金(1000円あればオーケー)

まずはデータです。

Twitterの公式アーカイブダウンロード機能を活用してダウンロードしましょう
ダウンロードされたデータにはこれまでの前ツイートと画像が含まれているので、整形選別する必要があります。ダウンロード申請は設定画面からいつでも行えますが凍結したアカウントは申請不可能なのと、申請してから落とせるまで二日くらいかかります。気長に待ちましょう。

次にお金

私は今回runpodというGPUサーバーを借りました。
最低チャージ額が確か1000円なのでそれくらいあるとおすすめです。デビットカードでも行けます。
GPUサーバーは借りるGPUによりますが今回使用した4090の場合だと一時間0.59ドル(90円くらい)でレンタルできました。あまったクレジットは適当にA1111でも回してあんな画像やこんなイラストでも生成して消費するのもいいですし、次回のためにとって置いてもいいでしょう。

詳しいやり方解説

データを用意して整形する

データが用意できたらまずFAQ形式に整形する必要があります。そしてjsonlと言う拡張子のファイルに整形したデータをぶち込む必要があります。

Twitterのデータを今回は使用したため短文が多く、AIも「おっそうだな」みたいな短い返事しかしなくなることがあります。そのため、短いデータを排除してもらって長文を水増してもらうといいでしょう。自分のブログなどあればなお良いです。

claudecodeやopenclawなどのエージェントAIにやらせましょう
手動でやると苦痛です

クラウドGPUを借りる

まずはrunpodに登録しましょう!ここからできます!(アフィではありません)

AI and Cloud Infrastructure Provider | Runpod
AI infrastructure with on-demand GPUs and serverless compute. Run training, inference, and batch workloads on the cloud ...

そして早速1000円ほど入金したあとにGPUサーバーを借りましょう。流れはこうです。

  • pod templatesから【pytorch 2.4.0】を選ぶ(2.8だと今回の4090では動作しません)
  • GPUで4090を選択
  • instance pricingはon demandを選ぶ(一番無難)
  • 容量は増やしても誤差の値段くらいしか変わらないのでコンテナディスク、ボリュームディスクともに100gbくらいにしときましょう。取り敢えずこれだけあれば書き出しの時に詰まりません。
  • あとはデプロイをポチー

これでGPU鯖の用意はできました!

(注意、GPUサーバーは従量課金なので終わったらしっかりstopをかけましょう。データの保管にもお金が発生するので、もうこの環境は使用しないとなったら遠慮なくterminate podしてください。)

いざファインチューニング

いざファインチューニングです。
ですがその前に、webUIの使い方を説明します。

webUIはjupiter notebookという形式で、これは「ブラウザからシェルのコマンドやPythonのコードを簡単に叩けるツール」と思っておけばいいです。

新しいノートブックを作成して、新しいセルを作る(四角いテキストボックス)。そのあと実行したいコードを入力して左上の▶️ボタンで実行できます

ここにコードを貼ってゴニョゴニョする必要がありますがここでは解説しません。AIに聞いてもらえると助かります、、、。(主が何にもわからないため)

簡単にいうとunslothというツールにデータとモデルをぶち込んでうぃーーーーんってするだけ。
簡単です!

ファインチューニングには、私は今回NeverSleep/Lumimaid-v0.2-12Bを使いましたが学習に20分、書き出しに20分ほど見ておけばいいです。なのでそんなに時間はかかりません。息子のお世話でもして気長に待ちましょう。

そうして出来上がったのがこいつだぁ

そうやってファインチューニングしたあと出来上がったのがこいつです。秋ノ原AI。

順調に変態ですね。

こいつをrx590に常駐させて、二時間に一回TwitterのAPI(従量課金になって嬉しい)で投稿させてます。
一日15円くらいかかるのかあ
ジュース我慢してお金節約します

最後に一言

めちゃくちゃ楽しいよ

それでは!

コメント

タイトルとURLをコピーしました