最近のAIツールの進歩についての所感

最近のAIの進歩は早すぎる

ここのところ毎日OpenAIが何かしらの発表をしている。O1とか、Apple Intelligenceとの統合とか、高度な音声モードのカメラ対応とか。それに負けじとGoogleもGemini 2.0 Flashを発表してきて、ものすごい速さでいろいろなAIツールが出てきているし、アップデートされている。

中でも、Google AI Studioで試せる「Gemini 2.0 Flash」の性能には驚いた。リアルタイムでの自然な会話が可能で、応答も素早く、割り込みができるので、会話に不自然な間が生じない。まぁ、こっちが考えて間が空くと向こうが喋ってくるので「ちょっと待って、人の話は最後まで聞こうよ」的な感じを受けることもあるけど・・・さらに、ウェブカメラで物を見せると、それが何かを認識して会話できる。実際に、この前買って届いたカーテンの箱を見せただけで、カーテンだと推測してみせた。

試してないけど、画面をキャプチャをしながら、表示されているものを認識して対話もできるので、たとえばトラブルシューティングの場面で詳しい人がいなくても「これどうすればいいの?」というのを見せながら聞けば答えてくれるんじゃないだろうか?ITに明るくない人や、高齢の親世代のサポートにも使えそうだな、と。

最近では、Googleで検索するより「Perplexity」で調べることも増えた。「Felo」も今日始めて使ってみたけど、Proモードを使えばかなり細かく調べてまとめてくれるので、自分で検索してサイトを見て情報を整理するより効率的に情報を得られる感じ。

画像生成AIもたまに使うけど、Googleの「ImageFX」、Adobeの「Firefly」、「Leonardo.ai」あたりを使うことが多い。あとはChatGPTの画像生成も時々といった感じ。実際まだ画像生成を実用的に使うというアイデアが余り浮かばないので、遊び感覚で触っている。

アプリを作ってくれるv0とかBoltとかはまだ様子見。v0はちょっと触ったけど、画面レイアウトをReactで作ってくれても、結局それを既存のプロダクトに組み込む段階で色々手直しが必要になるので、最初からVSCodeでコードアシスタントを使いながら書いたほうが早いかな、という感想。最初のモックを作ったりするのには使えるのかな?

AI技術は、今後もっと身近になっていくんだろうなと思う。話し相手とか相談相手のような。たとえば、車が発明される前は、移動手段は馬車とか歩きだったわけだけど、車がいまでは当たり前に走ってそれで移動している。AIも同じように当たり前になる日が来るんだろうな、と。

とはいっても、情報を追いすぎると振り回されるので、そこには気をつけたい。

関連記事