Claude vs Codex · Visual Frontend Benchmark

Metode og begrensninger

PromptSamme kjernekrav

Premium vanilla frontend, mission queue, evidence panel, architecture flow, ingen eksterne assets.

Claude-laneClaude Opus 4.8

Genererte kildefiler via Claude Code/Max OAuth. Full tool-run hanget i tenking; filgenerering ble materialisert trygt etterpå.

Codex-laneOpenAI Codex / GPT‑5.5

Lokal Codex CLI hadde utløpt ChatGPT-token; denne lane ble laget av aktiv Hermes OpenAI-Codex session.

DeployCloudflare Pages

Statisk benchmark-surface med noindex-header. Kandidatene er embedet som live iframes.

Scorekort

Ren, kompakt layout og fungerende queue.
OK terminal/flow, men mer generisk og mindre produktspesifikk.
Svakere første viewport: sier “Mission Control”, men mindre direkte Gibson/verifikasjonsverdi.

Tydelig verdi i første viewport: observe/rank/dispatch/verify/brain.
Mer komplett dashboard med detaljpanel, filter, actions, flow og credible evidence ledger.
Best microcopy, accessibility labels og produktspesifikk operasjonell følelse.

Live visual compare

Candidate A

Åpne fullskjerm

Candidate B

Åpne fullskjerm

Rubrikk

Kriterium	Claude	Codex	Kommentar
Første viewport	7/10	10/10	Codex kommuniserer hele operasjonsloopen uten scroll.
Visuell polish	8/10	9/10	Claude er pen, Codex er mer premium og mer ferdig.
Interaktivitet	7/10	9/10	Codex har flere tydelige handlinger og bedre state-feedback.
Produktspesifikk microcopy	7/10	10/10	Codex treffer agent-factory/verifikasjon mye hardere.
Kode/struktur	8/10	8/10	Begge er static-vennlige, ingen remote assets.