100 word summary

Write N of X

Write exactly N words/sentences/paragraphs...

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
Claude Opus 4.6 (Reasoning)	100%
Gemini 3.1 Pro (Preview)	100%
Z.AI GLM 5.1	100%
Z.AI GLM 5 Turbo	100%
Claude Sonnet 4.6 (Reasoning)	100%
Grok 4.3 (Reasoning)	100%
MoonshotAI: Kimi K2.6	100%
Qwen 3.5 397B A17B	100%
Gemma 4 31B (Reasoning)	100%
Qwen 3.5 122B	100%
Qwen 3.5 Plus (2026-04-20)	100%
Gemma 4 26B (Reasoning)	100%
Z.AI GLM 5	100%
Qwen 3.5 27B	100%
Qwen 3.6 Flash	100%
Gemini 3 Flash (Preview, Reasoning)	100%
Gemini 3 Pro (Preview)	100%
Z.AI GLM 4.7	100%
Qwen 3.5 35B	100%
GPT-OSS 120B	100%

	Score	Cost	Time
Stealth: Aurora Alpha	100%	—	2.8s
Inception Mercury	99%	$0.0002	4.2s
Gemini 3.1 Flash Lite (Preview)	100%	$0.0006	1.2s
GPT-4o Mini (temp=0)	100%	$0.0003	15.2s
Inception Mercury 2	99%	$0.0013	1.6s
GPT-5.4 Nano (Reasoning)	100%	$0.0011	5.1s
Gemini 3 Flash (Preview)	99%	$0.0012	1.8s
GPT-5.4 Nano (Reasoning, Low)	90%	$0.0009	4.3s
Nemotron 3 Super	100%	$0.0000	19.9s
GPT-4.1	99%	$0.0023	3.1s
Gemini 3.1 Flash Lite	98%	$0.0006	1.2s
Gemini 3.1 Flash Lite (Reasoning)	98%	$0.0006	1.2s
GPT-5.4 Mini	82%	$0.0011	1.2s
Gemma 4 31B	96%	$0.0003	6.4s
GPT-5.4 Mini (Reasoning, Low)	95%	$0.0026	2.6s
GPT-5.4 Mini (Reasoning)	100%	$0.0040	4.9s
Nemotron 3 Nano	90%	$0.0003	20.6s
GPT-OSS 120B	100%	$0.0007	57.3s
GPT-5 Mini	100%	$0.0033	15.8s
GPT-4o, Aug. 6th (temp=1)	100%	$0.0051	2.2s

	Score	Cost	Speed	Stability
Stealth: Aurora Alpha	100%	—	2.8s	100%
Gemini 3.1 Flash Lite (Preview)	100%	$0.0006	1.2s	99%
GPT-5.4 Nano (Reasoning)	100%	$0.0011	5.1s	100%
Gemini 3 Flash (Preview)	99%	$0.0012	1.8s	98%
GPT-4o Mini (temp=0)	100%	$0.0003	15.2s	99%
Inception Mercury	99%	$0.0002	4.2s	95%
Nemotron 3 Super	100%	$0.0000	19.9s	99%
Inception Mercury 2	99%	$0.0013	1.6s	95%
GPT-5.4 Mini (Reasoning)	100%	$0.0040	4.9s	99%
Gemini 3.1 Flash Lite (Reasoning)	98%	$0.0006	1.2s	94%
GPT-4.1	99%	$0.0023	3.1s	95%
GPT-4o, Aug. 6th (temp=1)	100%	$0.0051	2.2s	99%
Gemini 3.1 Flash Lite	98%	$0.0006	1.2s	93%
GPT-5 Mini	100%	$0.0033	15.8s	99%
GPT-5 Nano	100%	$0.0013	31.1s	99%
GPT-5.5	99%	$0.0070	4.1s	98%
GPT-4o, Aug. 6th (temp=0)	97%	$0.0051	2.4s	92%
Gemma 4 26B	95%	$0.0002	10.1s	89%
Qwen 3.6 Flash	100%	$0.0080	23.7s	100%
GPT-OSS 120B	100%	$0.0007	57.3s	100%

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	# 6	# 7	# 8	# 9	# 10	Total
78	Claude Opus 4.6 (Reasoning)	$0.067	25.1s	100%	100	100	100	100	100	100	100	100	100	100	100%
81	Gemini 3.1 Pro (Preview)	$0.066	51.0s	100%	100	100	100	100	100	100	100	100	100	100	100%
67	Z.AI GLM 5.1	$0.024	2.5m	100%	100	100	100	100	100	100	100	100	100	100	100%
25	Z.AI GLM 5 Turbo	$0.011	24.4s	100%	100	100	100	100	100	100	100	100	100	100	100%
57	Claude Sonnet 4.6 (Reasoning)	$0.041	24.6s	100%	100	100	100	100	100	100	100	100	100	100	100%
31	Grok 4.3 (Reasoning)	$0.011	40.2s	100%	100	100	100	100	100	100	100	100	100	100	100%
54	MoonshotAI: Kimi K2.6	$0.014	1.9m	100%	100	100	100	100	100	100	100	100	100	100	100%
90	Qwen 3.5 397B A17B	$0.035	4.0m	100%	100	100	100	100	100	100	100	100	100	100	100%
66	Gemma 4 31B (Reasoning)	$0.0023	4.1m	100%	100	100	100	100	100	100	100	100	100	100	100%
58	Qwen 3.5 122B	$0.031	1.2m	100%	100	100	100	100	100	100	100	100	100	100	100%
47	Qwen 3.5 Plus (2026-04-20)	$0.014	1.4m	100%	100	100	100	100	100	100	100	100	100	100	100%
77	Gemma 4 26B (Reasoning)	$0.0034	5.0m	100%	100	100	100	100	100	100	100	100	100	100	100%
49	Z.AI GLM 5	$0.017	1.3m	100%	100	100	100	100	100	100	100	100	100	100	100%
55	Qwen 3.5 27B	$0.022	1.5m	100%	100	100	100	100	100	100	100	100	100	100	100%
19	Qwen 3.6 Flash	$0.0080	23.7s	100%	100	100	100	100	100	100	100	100	100	100	100%
46	Gemini 3 Flash (Preview, Reasoning)	$0.025	38.8s	100%	100	100	100	100	100	100	100	100	100	100	100%
62	Gemini 3 Pro (Preview)	$0.044	25.1s	100%	100	100	100	100	100	100	100	100	100	100	100%
61	Z.AI GLM 4.7	$0.010	2.9m	100%	100	100	100	100	100	100	100	100	100	100	100%
44	Qwen 3.5 35B	$0.019	55.1s	100%	100	100	100	100	100	100	100	100	100	100	100%
20	GPT-OSS 120B	$0.0007	57.3s	100%	100	100	100	100	100	100	100	100	100	100	100%
53	Qwen 3.5 9B	$0.0017	2.7m	100%	100	100	100	100	100	100	100	100	100	100	100%
74	Qwen3.6 Max Preview	$0.039	2.0m	100%	100	100	100	100	100	100	100	100	100	100	100%
40	GPT-5.5 (Reasoning)	$0.026	9.5s	100%	100	100	100	100	100	100	100	100	100	100	100%
24	Qwen 3.6 35B	$0.0067	39.3s	100%	100	100	100	100	100	100	100	100	100	100	100%
76	ByteDance Seed 2.0 Mini	$0.0044	4.7m	100%	100	100	100	100	100	100	100	100	100	100	100%
28	Qwen 3.5 Flash	$0.0039	1.0m	100%	100	100	100	100	100	100	100	100	100	100	100%
32	ByteDance Seed 2.0 Lite	$0.0065	1.2m	100%	100	100	100	100	100	100	100	100	100	100	100%
1	Stealth: Aurora Alpha	—	2.8s	100%	100	100	100	100	100	100	100	100	100	100	100%
35	MoonshotAI: Kimi K2.5	$0.0098	1.0m	100%	100	100	100	100	100	100	100	100	100	100	100%
3	GPT-5.4 Nano (Reasoning)	$0.0011	5.1s	100%	100	100	100	100	100	100	100	100	100	100	100%
27	o4 Mini	$0.011	25.6s	100%	100	100	100	100	100	100	100	100	100	100	100%
38	ByteDance Seed 1.6	$0.0078	1.3m	100%	100	100	100	100	100	100	100	100	100	100	100%
7	Nemotron 3 Super	$0.0000	19.9s	99%	100	100	100	100	100	100	100	100	100	98	100%
9	GPT-5.4 Mini (Reasoning)	$0.0040	4.9s	99%	100	100	100	100	100	100	100	100	100	98	100%
15	GPT-5 Nano	$0.0013	31.1s	99%	100	100	100	100	100	100	100	100	100	98	100%
14	GPT-5 Mini	$0.0033	15.8s	99%	100	100	100	100	100	100	100	100	100	98	100%
5	GPT-4o Mini (temp=0)	$0.0003	15.2s	99%	100	100	100	100	100	100	100	100	100	98	100%
29	GPT-5.4 (Reasoning)	$0.012	22.2s	99%	100	100	100	100	100	100	100	100	98	98	100%
2	Gemini 3.1 Flash Lite (Preview)	$0.0006	1.2s	99%	100	100	100	100	100	100	100	100	98	98	100%
50	o4 Mini High	$0.012	1.6m	99%	100	100	100	100	100	100	100	98	98	98	100%
23	GPT-5.1	$0.011	14.3s	99%	100	100	100	100	100	100	100	98	98	98	100%
12	GPT-4o, Aug. 6th (temp=1)	$0.0051	2.2s	99%	100	100	100	100	100	100	100	98	98	98	100%
22	GPT-5.2	$0.011	9.7s	98%	100	100	100	100	100	100	98	98	98	98	99%
16	GPT-5.5	$0.0070	4.1s	98%	100	100	100	100	100	100	98	98	98	98	99%
4	Gemini 3 Flash (Preview)	$0.0012	1.8s	98%	100	100	100	100	100	100	98	98	98	98	99%
8	Inception Mercury 2	$0.0013	1.6s	95%	100	100	100	100	100	100	100	100	100	92	99%
6	Inception Mercury	$0.0002	4.2s	95%	100	100	100	100	100	100	100	100	100	92	99%
51	Grok 4.20 (Beta, Reasoning)	$0.028	15.1s	95%	100	100	100	100	100	100	100	100	98	92	99%
11	GPT-4.1	$0.0023	3.1s	95%	100	100	100	100	100	100	100	98	98	92	99%
33	Claude Opus 4.7	$0.018	4.1s	95%	100	100	100	100	100	100	98	98	98	92	99%
42	Z.AI GLM 4.7 Flash	$0.0024	1.6m	94%	100	100	100	100	100	100	100	100	92	92	98%
10	Gemini 3.1 Flash Lite (Reasoning)	$0.0006	1.2s	94%	100	100	100	98	98	98	98	98	98	92	98%
26	GPT-4o Mini (temp=1)	$0.0003	46.8s	93%	100	100	100	100	100	98	98	98	92	92	98%
45	GPT-5.5 (Reasoning, Low)	$0.021	7.9s	86%	100	100	100	100	100	100	100	100	100	77	98%
13	Gemini 3.1 Flash Lite	$0.0006	1.2s	93%	100	100	100	98	98	98	98	98	92	92	98%
39	Claude Opus 4.7 (Reasoning)	$0.018	7.2s	93%	100	100	100	100	100	100	98	92	92	92	97%
36	Claude Opus 4.5	$0.012	5.1s	87%	100	100	100	100	100	100	100	98	98	77	97%
17	GPT-4o, Aug. 6th (temp=0)	$0.0051	2.4s	92%	100	100	100	100	100	98	98	92	92	92	97%
21	Gemma 4 31B	$0.0003	6.4s	85%	100	100	100	98	98	98	98	98	92	77	96%
18	Gemma 4 26B	$0.0002	10.1s	89%	100	98	98	98	98	92	92	92	92	92	95%
37	GPT-5.4 Mini (Reasoning, Low)	$0.0026	2.6s	72%	100	100	100	100	100	100	100	100	98	54	95%
52	GPT-5	$0.017	21.1s	82%	100	100	100	100	100	100	98	98	77	77	95%
30	GPT-5.4 (Reasoning, Low)	$0.0044	3.4s	86%	100	100	98	98	98	98	92	92	92	77	95%
43	Claude Opus 4.6	$0.012	4.8s	81%	100	100	100	100	98	98	98	92	77	77	94%
41	GPT-4o, May 13th (temp=0)	$0.0096	11.8s	81%	100	100	100	100	98	98	98	92	77	77	94%
48	Claude Sonnet 4.6	$0.0076	4.4s	70%	100	100	98	98	98	92	92	92	92	54	92%
73	Grok 4.20 (Reasoning)	$0.013	40.0s	45%	100	100	100	100	100	100	100	100	100	9	91%
34	GPT-4.1 Mini	$0.0004	2.3s	75%	100	100	98	98	92	92	92	77	77	77	91%
86	Qwen 3.6 27B	$0.021	1.4m	40%	100	100	100	100	100	100	100	100	100	0	90%
63	Nemotron 3 Nano	$0.0003	20.6s	40%	100	100	100	100	100	100	100	100	100	0	90%
69	MiniMax M2.7	$0.0036	38.6s	40%	100	100	100	100	100	100	100	98	98	0	90%
60	GPT-5.4 Nano (Reasoning, Low)	$0.0009	4.3s	40%	100	100	100	100	100	100	98	98	98	0	90%
59	GPT-4o, May 13th (temp=1)	$0.0096	10.7s	62%	100	100	100	100	98	98	77	77	54	54	86%
56	GPT-5.4	$0.0033	3.5s	54%	100	98	98	98	92	92	92	77	77	27	85%
68	Claude 3.7 Sonnet	$0.0074	5.9s	43%	100	100	100	100	100	98	92	77	54	9	83%
65	GPT-5.4 Mini	$0.0011	1.2s	38%	100	100	100	98	98	98	92	77	54	0	82%
64	Gemini 2.5 Pro	$0.012	9.3s	58%	100	98	92	92	92	77	77	77	54	54	81%
72	DeepSeek V3 (2025-03-24)	$0.0007	6.5s	30%	100	100	100	98	92	92	92	92	27	0	79%
79	Claude Sonnet 4	$0.0075	4.5s	22%	100	100	100	98	98	98	98	92	2	0	79%
71	DeepSeek V3 (2024-12-26)	$0.0006	5.0s	35%	100	100	100	98	92	92	77	54	54	0	77%
70	Grok 4 Fast	$0.0004	2.6s	36%	100	100	98	92	92	92	77	77	27	9	77%
129	DeepSeek V4 Pro (Reasoning)	$0.0099	3.4m	21%	100	100	100	100	100	92	92	54	0	0	74%
82	Z.AI GLM 4.6	$0.0043	51.4s	33%	100	100	98	98	92	77	54	54	54	2	73%
75	Llama 3.1 70B	$0.0015	1.7s	31%	100	100	98	98	92	77	54	54	27	9	71%
114	Claude Opus 4	$0.038	10.6s	23%	100	100	100	98	77	77	77	27	27	0	69%
102	Aion 2.0	$0.0060	1.2m	11%	100	100	100	100	100	98	77	0	0	0	68%
80	GPT-4.1 Nano	$0.0001	2.0s	21%	100	100	98	92	77	77	54	54	2	0	65%
84	Grok 4.20	$0.0021	2.4s	18%	100	100	100	98	92	77	54	27	2	0	65%
85	LFM2 24B	$0.0001	5.0s	17%	100	100	92	92	77	54	54	27	0	0	60%
83	GPT-5.4 Nano	$0.0005	1.4s	23%	100	100	92	77	77	54	27	27	27	9	59%
94	Stealth: Healer Alpha	$0.0000	15.1s	5%	100	100	100	100	100	77	2	0	0	0	58%
92	Hermes 3 405B	$0.0000	13.3s	11%	100	100	98	98	77	77	27	0	0	0	58%
89	Stealth: Hunter Alpha	$0.0000	18.4s	18%	100	100	77	77	54	54	54	54	0	0	57%
87	Xiaomi MIMO v2.5	$0.0012	6.1s	19%	100	92	92	77	77	54	27	27	9	0	56%
96	Mistral Large 2	$0.0044	4.0s	7%	100	100	100	92	77	77	0	0	0	0	55%
88	Grok 4.20 (Beta)	$0.0014	947ms	17%	100	98	77	77	54	54	54	27	2	2	54%
130	Mistral Large	$0.018	1.1m	7%	100	100	92	92	92	54	0	0	0	0	53%
98	Grok 4	$0.0085	11.5s	12%	100	92	92	92	77	54	9	9	2	2	53%
93	Gemma 3 12B	$0.0001	3.3s	9%	100	92	92	92	92	54	2	2	0	0	53%
91	Gemini 2.5 Flash Lite	$0.0002	855ms	16%	98	98	77	77	54	54	27	27	0	0	51%
97	Claude 3.5 Sonnet	$0.0074	8.9s	13%	100	98	92	77	54	54	27	9	0	0	51%
109	MiniMax M2.5	$0.0016	33.5s	2%	100	100	100	100	92	9	0	0	0	0	50%
101	Claude Sonnet 4.5	$0.0074	4.6s	8%	100	100	98	77	77	27	9	9	0	0	50%
99	Mistral Medium 3.1	$0.0009	4.0s	4%	100	92	92	92	77	9	0	0	0	0	46%
106	Z.AI GLM 4.5 Air	$0.0007	17.0s	2%	100	98	98	92	54	2	0	0	0	0	44%
100	Gemini 2.5 Flash Lite (Reasoning)	$0.0005	4.3s	5%	98	98	92	77	27	27	9	2	0	0	43%
95	Ministral 3 8B	$0.0003	1.3s	15%	77	77	77	77	77	27	9	0	0	0	42%
105	Llama 3.1 8B	$0.0003	828ms	0%	100	100	100	98	9	2	0	0	0	0	41%
107	Gemini 2.5 Flash	$0.0006	1.4s	0%	100	100	100	92	9	0	0	0	0	0	40%
118	Gemini 2.5 Flash (Reasoning)	$0.0055	10.0s	1%	100	100	100	77	9	9	2	2	0	0	40%
103	Z.AI GLM 4.5	$0.0007	5.9s	6%	100	100	92	27	27	27	9	9	2	0	39%
104	DeepSeek-V2 Chat	$0.0003	8.2s	8%	100	77	77	54	27	27	0	0	0	0	36%
111	Mistral Small 4 (Reasoning)	$0.0012	9.8s	4%	100	92	77	27	27	9	9	2	0	0	34%
110	Mistral Large 3	$0.0010	3.7s	5%	98	77	77	54	27	9	0	0	0	0	34%
116	Qwen 2.5 72B	$0.0007	4.7s	0%	100	100	77	54	2	0	0	0	0	0	33%
113	Ministral 3 3B	$0.0002	1.1s	1%	100	92	77	54	9	0	0	0	0	0	33%
112	Arcee AI: Trinity Large (Preview)	$0.0000	3.9s	2%	100	92	92	27	9	9	2	0	0	0	33%
108	Grok 4.1 Fast	$0.0005	4.7s	8%	92	77	54	54	54	0	0	0	0	0	33%
119	Cohere Command R+ (Aug. 2024)	$0.0055	3.4s	6%	92	77	54	54	27	9	9	0	0	0	32%
115	Ministral 3 14B	$0.0004	1.7s	0%	100	100	100	9	9	0	0	0	0	0	32%
117	DeepSeek V4 Flash	$0.0001	2.4s	0%	100	100	77	27	0	0	0	0	0	0	30%
120	Llama 3.1 Nemotron 70B	$0.0006	4.7s	5%	100	54	54	27	27	2	0	0	0	0	26%
121	Gemma 3 27B	$0.0002	4.7s	1%	98	92	27	27	9	0	0	0	0	0	25%
122	Hermes 3 70B	$0.0007	6.6s	0%	100	100	54	0	0	0	0	0	0	0	25%
126	DeepSeek V3.1	$0.0004	8.9s	0%	100	54	54	0	0	0	0	0	0	0	21%
127	Xiaomi MIMO v2.5 Pro	$0.0015	8.4s	0%	98	54	54	2	0	0	0	0	0	0	21%
125	DeepSeek V3.2	$0.0005	6.1s	0%	100	77	27	2	0	0	0	0	0	0	21%
124	DeepSeek V4 Flash (Reasoning)	$0.0001	3.6s	0%	100	100	2	0	0	0	0	0	0	0	20%
123	Mistral Small 4	$0.0003	2.1s	0%	98	92	9	0	0	0	0	0	0	0	20%
128	Arcee AI: Trinity Mini	$0.0001	2.4s	0%	54	54	27	2	0	0	0	0	0	0	14%
135	Qwen 3 32B	$0.0004	11.6s	0%	100	9	9	2	0	0	0	0	0	0	12%
138	DeepSeek V4 Pro	$0.0013	11.5s	0%	77	27	0	0	0	0	0	0	0	0	10%
134	Qwen3 235B A22B Instruct 2507	$0.0003	6.8s	0%	77	27	0	0	0	0	0	0	0	0	10%
136	Claude Haiku 4.5	$0.0024	2.3s	0%	98	0	0	0	0	0	0	0	0	0	10%
131	Ministral 3B	$0.0001	914ms	0%	98	0	0	0	0	0	0	0	0	0	10%
132	Mistral Small Creative	$0.0002	1.1s	0%	92	0	0	0	0	0	0	0	0	0	9%
133	Ministral 8B	$0.0002	2.6s	0%	92	0	0	0	0	0	0	0	0	0	9%
139	Qwen 3.5 Plus (2026-02-15)	$0.0010	6.9s	0%	77	2	2	0	0	0	0	0	0	0	8%
140	Writer: Palmyra X5	$0.0020	3.9s	0%	27	27	9	2	0	0	0	0	0	0	7%
137	Mistral Small 3.2 24B	$0.0002	3.4s	0%	54	9	2	0	0	0	0	0	0	0	6%
141	ByteDance Seed 1.6 Flash	$0.0004	6.7s	0%	27	0	0	0	0	0	0	0	0	0	3%
144	Grok 4.3	$0.0020	1.9s	0%	2	0	0	0	0	0	0	0	0	0	0%
143	Mistral NeMO	$0.0003	2.9s	0%	0	0	0	0	0	0	0	0	0	0	0%
145	Rocinante 12B	$0.0007	23.7s	0%	0	0	0	0	0	0	0	0	0	0	0%
142	Gemma 3 4B	$0.0001	2.8s	0%	0	0	0	0	0	0	0	0	0	0	0%
147	Claude 3 Haiku	$0.0005	32.2s	0%	0	0	0	0	0	0	0	0	0	0	0%
146	WizardLM 2 8x22b	$0.0018	21.9s	0%	0	0	0	0	0	0	0	0	0	0	0%
68.41%

Write N of X

100 word summary

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)