3つのバイブ・コーディングツールで同じアプリを作ってみた

3つのバイブ・コーディングツールで同じアプリを作ってみた

2026年6月12日

話題の「バイブ・コーディング(vibe coding)」ツール3つを使い、厳格な比較テストを行うことにしました。コードは一切書かず、ただ目的を伝え、プロンプトを入力するだけ。お題はシンプルながらも負荷の高いものに設定しました。認証済みのクライアント・フリーランサーログイン、検索可能なマーケットプレイス、動的な予約フォーム、ロール別のダッシュボード、そしてStripe決済ゲートウェイを備えた、地域密着型のフリーランサー採用ディレクトリです。

そこから待っていたのは、瞬時に形になる快感と、それに続くレイアウトの崩壊、不透明な請求ループ、そして構造的なデグレという激しい乱高下でした。完璧だった最初のプロンプトによるデモが、現実世界の複雑さに直面する様子を目の当たりにし、アプリケーション全体の設計をAIの自動生成だけに頼ったときに、どこで「魔法」が解けるのかが明確になりました。

共通のお題と、初回プロンプトによる衝撃

プロジェクトは、BoltLovableReplitの3つのプラットフォームで開始しました。ターゲットは、標準的でありながら要求水準の高いSaaS MVP。まさに私たちのSaaS MVPランキングに掲載されているようなアプリケーションです。最初のプロンプトを入力した瞬間、3つのツールすべてのスピードに本気で驚かされました。わずか3分ほどで、どのプラットフォームも美しいCSSレイアウトを構築し、リレーショナルデータベースのスキーマを初期化し、実際に操作可能なWebプレビューをレンダリングしました。

中でも最速だったのはBoltでした。ブラウザネイティブのWebContainersを使用し、ブラウザタブ内で即座に完全なNode.jsコンテナを立ち上げました。Lovableも僅差で続き、バックエンドにSupabaseインスタンスを自動的にプロビジョニングし、フロントエンドにはクリーンで可読性の高いReactとTypeScriptコンポーネントを構築しました。Replit Agentは最も構造的なアプローチを取り、独立したワークスペースコンテナを初期化し、内部的な自己リフレクションループを回してパッケージのインストールと設定を検証してから画面を表示しました。

最初の1時間を色々と操作して回っている間、私たちはバイブ・コーディング時代の真の「快感」を味わいました。ターミナルを一度も開かず、ローカルホストの手動設定もなしに、リッチなビジュアルスタイリングを備えた動作するプロトタイプをわずか数分で構築できるのです。しかし、すぐに気づいたのは、プロトタイプ作成は戦いの70%に過ぎないということ。残りの30%を占めるカスタムビジネスロジックこそが、これらのシステムの限界を試すことになります。

プレッシャーに耐えかね、崩壊したポイント

見た目の改善要求を止め、実際の深い統合を求めた瞬間、綻びが見え始めました。Boltでは、反復的なデータベース更新を繰り返すうちに、コードが冗長に膨れ上がりました。Boltは精密な多段階の変更を行うよりも、ファイル全体を書き直す傾向があるためです。この肥大化こそが、不要なファイルを削除し、アカウントに数百万の未使用トークンが残っているにもかかわらず、ユーザーが「プロジェクトが大きすぎます」というアカウント制限に直面する原因です。

Lovableの場合、限界が来たのはユーザー認証のルーティングとSupabaseのセキュリティ設定でした。認証済みユーザーのみに予約フォームを利用させるため、AIはバックグラウンドでSupabaseの行レベルセキュリティ(RLS)ルールを書き込もうとしました。結果、RLSエラーを修正するとフロントエンドのダッシュボードの表示が壊れるという無限の「デグレ・ループ」に陥り、手動でバックエンドの権限を書き直すまで、クライアントデータが未認証のビューにさらされる状態になりました。

Replit Agentはまた別の、ある種滑稽な失敗モードを見せました。PostgreSQLバックエンドに加えて、プッシュ通知用にFirebaseを接続するよう求めたところ、エージェントが循環的な動作に陥りました。コンパイル時の依存関係バグを修正したと繰り返し伝えながら、リロードすると全く同じエラーが表示されるのです。Replitのユーザーも同様のパターンを報告しています。エージェントが偽の修正を報告し、サイレントなデータベースチェックポイントを生成して利用料金を積み上げる間、ユーザーはバグがまだ存在することを証明するためにスクリーンショットをチャットに貼り付け続けることになります。

クレジットの消費と「プロンプト・もぐら叩き」のコスト

バイブ・コーディングのコストは線形ではありません。基本の開発者アクセスプランは月額20〜25ドル程度から始まりますが、バグの反復修正は驚くべき速さでクレジットを消費します。Lovableの有料プランでは、1つのプロンプトで複数のトークンが消費されます。壊れたデータベースのリレーションを修正するための急速なトラブルシューティングループの間、月間クレジットが猛烈な勢いで減っていくのがわかりました。編集に失敗したりデグレが発生したりすれば、昨日まで動いていたバージョンに戻すためだけに、実質的に資金的なランウェイを燃やしていることになります。

Replitでは、金銭的なサプライズはさらに深刻でした。Replit Agentは完全なVMタスクを実行し、ほぼすべてのチェックポイントで自動データベースバックアップを行うため、単純なテストビルドでさえ最大1,500ドルの予期せぬデータベース超過料金が発生したという報告があります。私たちのデバッグループでも、エージェントはnpmパッケージのダウンロード、テスト、失敗、コンテナプロセスの再実行を自動で繰り返し、膨大な請求サイクルを消費しました。ちょっとしたテストが、高価な教訓へと変わった瞬間です。

Boltのように月間のトークン上限が高くても、罠はあります。AIがコード修正ループに陥り、gitのようなクリーンな差分ではなくファイル全体を書き換え始めると、アプリのパフォーマンスが全く向上しないままトークンを激しく消費します。チャットプロンプトによるアプリケーションのデバッグは、経済的に極めて効率の悪いモデルであることにすぐに気づくでしょう。

結論と、正直な分かれ道

今回の比較テストで、あるアーキテクチャ上の真実が明確になりました。それは、「コアとなるソフトウェア基盤をAIにゼロから構築させてはいけない」ということです。実際のユーザー、セキュリティ権限、本番データの要件があるツールを構築するのであれば、Softrを選ぶべきです。認証、ロールベースの可視性、データベース接続は、AIが生成し、あなたが監査したこともないコードではなく、視覚的に設定できるプラットフォーム機能だからです。

コードファーストのスタックを好み、最終的にCursorのような自動化されたローカル開発IDEへ移行したいと考えている方には、標準的なフロントエンド書き出し、迅速なスキャフォールディング、クリーンなコードの移植性を備えたBoltが最適です。運用ワークフローごとのプラットフォーム比較については、詳細なバイブ・コーディング向けベスト・ノーコードプラットフォームランキングをご覧ください。

クライアントポータルや社内CRMのような標準的なビジネスアプリを構築したい場合は、基本設定にプロンプトコンソールを使わないでください。データベースと認証には実績のあるビジュアルインフラを使用し、バイブ・コーディングによるカスタムコンポーネントは、スコープが限定され安全な個別の機能レベルのみに適用してください。ビジネスアプリにおける「2日目」に重要なのは、バイブ(雰囲気)ではなく安定性です。

ツールを比較する

バイブコーディングを始めますか?

実際のビルドに基づいてツールをランク付けしています。ツールを選ぶ前に位置づけを確認しましょう。

ランキングを見る →