Character dialogue (French) in a story

Language Writing

Can the model generate text in different languages?

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
Claude Opus 4.6 (Reasoning)	100%
Qwen3.6 Max Preview	100%
Gemini 3.1 Pro (Preview)	100%
Z.AI GLM 5 Turbo	100%
Grok 4.3 (Reasoning)	100%
GPT-5.1	100%
Claude Opus 4.6	100%
MoonshotAI: Kimi K2.6	100%
GPT-5	100%
Qwen 3.5 397B A17B	100%
Gemma 4 31B (Reasoning)	100%
Qwen 3.5 122B	100%
Qwen 3.5 Plus (2026-04-20)	100%
Gemma 4 26B (Reasoning)	100%
Grok 4.20 (Beta, Reasoning)	100%
GPT-5.4 (Reasoning, Low)	100%
Grok 4.20 (Reasoning)	100%
Claude Sonnet 4.6	100%
MoonshotAI: Kimi K2.5	100%
Qwen 3.5 27B	100%

	Score	Cost	Time
Stealth: Aurora Alpha	100%	—	1.7s
Inception Mercury	100%	$0.0002	1.2s
GPT-4o Mini (temp=0)	100%	$0.0002	4.3s
Mistral NeMO	60%	$0.0001	4.9s
Llama 3.1 8B	78%	$0.0001	4.6s
Inception Mercury 2	100%	$0.0006	1.4s
GPT-4.1 Nano	93%	$0.0001	4.9s
Arcee AI: Trinity Mini	100%	$0.0002	6.1s
GPT-4.1 Mini	96%	$0.0005	3.4s
GPT-4o Mini (temp=1)	100%	$0.0003	8.0s
Grok 4.3	100%	$0.0008	3.5s
DeepSeek V4 Flash	100%	$0.0002	13.2s
DeepSeek V4 Flash (Reasoning)	80%	$0.0002	10.6s
Gemini 3.1 Flash Lite (Reasoning)	100%	$0.0011	3.5s
DeepSeek V3 (2025-03-24)	100%	$0.0005	13.9s
Gemini 3.1 Flash Lite (Preview)	100%	$0.0011	3.7s
Nemotron 3 Nano	97%	$0.0002	9.9s
Grok 4 Fast	96%	$0.0005	7.0s
Gemma 3 4B	96%	$0.0001	13.9s
DeepSeek-V2 Chat	100%	$0.0001	13.4s

	Score	Cost	Speed	Stability
Stealth: Aurora Alpha	100%	—	1.7s	100%
Inception Mercury	100%	$0.0002	1.2s	100%
Inception Mercury 2	100%	$0.0006	1.4s	100%
GPT-4o Mini (temp=0)	100%	$0.0002	4.3s	100%
Arcee AI: Trinity Mini	100%	$0.0002	6.1s	100%
Grok 4.3	100%	$0.0008	3.5s	100%
Gemini 3.1 Flash Lite (Reasoning)	100%	$0.0011	3.5s	100%
Gemini 3.1 Flash Lite (Preview)	100%	$0.0011	3.7s	100%
GPT-4o Mini (temp=1)	100%	$0.0003	8.0s	100%
Gemini 3.1 Flash Lite	100%	$0.0011	5.2s	100%
GPT-5.4 Nano (Reasoning)	100%	$0.0015	6.1s	100%
DeepSeek-V2 Chat	100%	$0.0001	13.4s	100%
DeepSeek V4 Flash	100%	$0.0002	13.2s	100%
GPT-5.4 Mini (Reasoning, Low)	100%	$0.0023	3.4s	100%
Gemini 3 Flash (Preview)	100%	$0.0020	5.5s	100%
GPT-5.4 Nano	100%	$0.0018	6.8s	100%
DeepSeek V3 (2025-03-24)	100%	$0.0005	13.9s	100%
Hermes 3 70B	100%	$0.0003	15.8s	100%
Z.AI GLM 4.5 Air	100%	$0.0007	13.6s	100%
GPT-5.4 Nano (Reasoning, Low)	100%	$0.0015	6.2s	99%

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	Total
118	Claude Opus 4.6 (Reasoning)	$0.041	36.5s	100%	100	100	100	100	100	100%
135	Qwen3.6 Max Preview	$0.037	2.7m	100%	100	100	100	100	100	100%
115	Gemini 3.1 Pro (Preview)	$0.039	42.3s	100%	100	100	100	100	100	100%
34	Z.AI GLM 5 Turbo	$0.0039	16.3s	100%	100	100	100	100	100	100%
95	Grok 4.3 (Reasoning)	$0.012	1.1m	100%	100	100	100	100	100	100%
104	GPT-5.1	$0.025	44.7s	100%	100	100	100	100	100	100%
112	Claude Opus 4.6	$0.037	35.6s	100%	100	100	100	100	100	100%
137	MoonshotAI: Kimi K2.6	$0.022	4.0m	100%	100	100	100	100	100	100%
132	GPT-5	$0.047	1.4m	100%	100	100	100	100	100	100%
109	Qwen 3.5 397B A17B	$0.015	2.0m	100%	100	100	100	100	100	100%
39	Gemma 4 31B (Reasoning)	$0.0006	38.1s	100%	100	100	100	100	100	100%
82	Qwen 3.5 122B	$0.013	30.1s	100%	100	100	100	100	100	100%
91	Qwen 3.5 Plus (2026-04-20)	$0.010	1.1m	100%	100	100	100	100	100	100%
79	Gemma 4 26B (Reasoning)	$0.0007	1.5m	100%	100	100	100	100	100	100%
96	Grok 4.20 (Beta, Reasoning)	$0.023	16.8s	100%	100	100	100	100	100	100%
72	GPT-5.4 (Reasoning, Low)	$0.012	16.5s	100%	100	100	100	100	100	100%
87	Grok 4.20 (Reasoning)	$0.0098	54.9s	100%	100	100	100	100	100	100%
57	Claude Sonnet 4.6	$0.0097	13.1s	100%	100	100	100	100	100	100%
86	MoonshotAI: Kimi K2.5	$0.0071	1.1m	100%	100	100	100	100	100	100%
81	Qwen 3.5 27B	$0.0094	46.1s	100%	100	100	100	100	100	100%
61	ByteDance Seed 1.6	$0.0039	46.8s	100%	100	100	100	100	100	100%
65	Qwen 3.6 Flash	$0.0079	31.3s	100%	100	100	100	100	100	100%
29	GPT-5.4 Mini (Reasoning)	$0.0048	6.7s	100%	100	100	100	100	100	100%
38	Gemini 3 Flash (Preview, Reasoning)	$0.0052	11.5s	100%	100	100	100	100	100	100%
98	o4 Mini High	$0.019	42.5s	100%	100	100	100	100	100	100%
116	DeepSeek V4 Pro (Reasoning)	$0.0072	3.5m	100%	100	100	100	100	100	100%
106	Claude Opus 4.7	$0.033	15.5s	100%	100	100	100	100	100	100%
100	Qwen 3.6 27B	$0.014	1.3m	100%	100	100	100	100	100	100%
93	Claude Opus 4.5	$0.020	16.5s	100%	100	100	100	100	100	100%
51	Aion 2.0	$0.0030	42.1s	100%	100	100	100	100	100	100%
84	Z.AI GLM 4.6	$0.0043	1.3m	100%	100	100	100	100	100	100%
26	MiniMax M2.5	$0.0011	21.9s	100%	100	100	100	100	100	100%
85	Z.AI GLM 4.7	$0.0056	1.3m	100%	100	100	100	100	100	100%
28	GPT-4.1	$0.0042	8.2s	100%	100	100	100	100	100	100%
50	o4 Mini	$0.0075	16.9s	100%	100	100	100	100	100	100%
88	Grok 4	$0.015	30.2s	100%	100	100	100	100	100	100%
64	Claude Sonnet 4.5	$0.011	12.6s	100%	100	100	100	100	100	100%
35	Xiaomi MIMO v2.5 Pro	$0.0032	20.1s	100%	100	100	100	100	100	100%
21	Stealth: Hunter Alpha	$0.0000	18.6s	100%	100	100	100	100	100	100%
27	Gemma 4 31B	$0.0003	28.0s	100%	100	100	100	100	100	100%
45	Gemini 2.5 Flash (Reasoning)	$0.0071	13.9s	100%	100	100	100	100	100	100%
7	Gemini 3.1 Flash Lite (Reasoning)	$0.0011	3.5s	100%	100	100	100	100	100	100%
24	Z.AI GLM 4.5	$0.0013	16.0s	100%	100	100	100	100	100	100%
8	Gemini 3.1 Flash Lite (Preview)	$0.0011	3.7s	100%	100	100	100	100	100	100%
30	Gemma 4 26B	$0.0003	30.0s	100%	100	100	100	100	100	100%
10	Gemini 3.1 Flash Lite	$0.0011	5.2s	100%	100	100	100	100	100	100%
14	GPT-5.4 Mini (Reasoning, Low)	$0.0023	3.4s	100%	100	100	100	100	100	100%
48	GPT-4o, May 13th (temp=0)	$0.0090	8.2s	100%	100	100	100	100	100	100%
15	Gemini 3 Flash (Preview)	$0.0020	5.5s	100%	100	100	100	100	100	100%
12	DeepSeek-V2 Chat	$0.0001	13.4s	100%	100	100	100	100	100	100%
92	ByteDance Seed 2.0 Lite	$0.0069	1.4m	100%	100	100	100	100	100	100%
74	GPT-5.4	$0.013	18.5s	100%	100	100	100	100	100	100%
54	Claude 3.5 Sonnet	$0.0092	14.4s	100%	100	100	100	100	100	100%
22	Grok 4.20 (Beta)	$0.0033	3.4s	100%	100	100	100	100	100	100%
3	Inception Mercury 2	$0.0006	1.4s	100%	100	100	100	100	100	100%
1	Stealth: Aurora Alpha	—	1.7s	100%	100	100	100	100	100	100%
19	Z.AI GLM 4.5 Air	$0.0007	13.6s	100%	100	100	100	100	100	100%
23	Hermes 3 405B	$0.0000	20.9s	100%	100	100	100	100	100	100%
37	GPT-4o, Aug. 6th (temp=1)	$0.0059	6.7s	100%	100	100	100	100	100	100%
32	GPT-4o, Aug. 6th (temp=0)	$0.0051	6.3s	100%	100	100	100	100	100	100%
31	DeepSeek V3.1	$0.0005	29.8s	100%	100	100	100	100	100	100%
13	DeepSeek V4 Flash	$0.0002	13.2s	100%	100	100	100	100	100	100%
17	DeepSeek V3 (2025-03-24)	$0.0005	13.9s	100%	100	100	100	100	100	100%
25	Grok 4.20	$0.0021	12.2s	100%	100	100	100	100	100	100%
11	GPT-5.4 Nano (Reasoning)	$0.0015	6.1s	100%	100	100	100	100	100	100%
2	Inception Mercury	$0.0002	1.2s	100%	100	100	100	100	100	100%
9	GPT-4o Mini (temp=1)	$0.0003	8.0s	100%	100	100	100	100	100	100%
6	Grok 4.3	$0.0008	3.5s	100%	100	100	100	100	100	100%
4	GPT-4o Mini (temp=0)	$0.0002	4.3s	100%	100	100	100	100	100	100%
16	GPT-5.4 Nano	$0.0018	6.8s	100%	100	100	100	100	100	100%
18	Hermes 3 70B	$0.0003	15.8s	100%	100	100	100	100	100	100%
5	Arcee AI: Trinity Mini	$0.0002	6.1s	100%	100	100	100	100	100	100%
89	GPT-5.2	$0.017	25.8s	99%	100	100	100	100	99	100%
20	GPT-5.4 Nano (Reasoning, Low)	$0.0015	6.2s	99%	100	100	100	100	98	100%
107	GPT-5.5 (Reasoning, Low)	$0.031	22.8s	99%	100	100	100	100	98	100%
108	GPT-5.5 (Reasoning)	$0.032	18.5s	98%	100	100	100	100	98	99%
46	Z.AI GLM 5.1	$0.0038	22.9s	97%	100	100	100	100	96	99%
101	Claude Sonnet 4.6 (Reasoning)	$0.021	25.5s	97%	100	100	100	100	96	99%
97	Gemini 2.5 Pro	$0.021	19.5s	96%	100	100	100	100	95	99%
94	GPT-5.4 (Reasoning)	$0.018	27.5s	97%	100	100	100	98	97	99%
36	Xiaomi MIMO v2.5	$0.0022	12.9s	96%	100	100	100	100	95	99%
68	GPT-5 Mini	$0.0061	31.2s	96%	100	100	100	100	94	99%
47	Qwen 3.5 Flash	$0.0017	29.6s	95%	100	100	100	100	94	99%
33	Gemini 2.5 Flash	$0.0028	6.4s	95%	100	100	100	100	94	99%
83	GPT-5 Nano	$0.0027	1.1m	94%	100	100	100	100	93	99%
40	Gemma 3 27B	$0.0003	23.0s	94%	100	100	100	100	93	99%
110	GPT-5.5	$0.035	25.8s	97%	100	99	99	98	97	99%
59	GPT-OSS 120B	$0.0002	46.8s	94%	100	100	100	100	92	98%
76	DeepSeek V3.2	$0.0004	1.1m	94%	100	100	100	100	92	98%
52	Gemini 2.5 Flash Lite (Reasoning)	$0.0022	27.5s	93%	100	100	100	100	92	98%
70	GPT-4o, May 13th (temp=1)	$0.0095	8.6s	93%	100	100	100	100	92	98%
49	Gemma 3 12B	$0.0002	33.8s	93%	100	100	100	100	92	98%
119	Claude Opus 4.7 (Reasoning)	$0.041	18.5s	92%	100	100	100	100	90	98%
105	Gemini 3 Pro (Preview)	$0.026	20.1s	94%	100	100	100	94	94	98%
77	Claude 3.7 Sonnet	$0.011	12.8s	94%	100	100	100	94	94	98%
78	Qwen 3.6 35B	$0.0059	36.1s	94%	100	100	100	94	93	97%
53	Mistral Large	$0.0032	9.5s	89%	100	100	100	100	86	97%
41	Nemotron 3 Nano	$0.0002	9.9s	89%	100	100	100	100	86	97%
62	Nemotron 3 Super	$0.0000	31.0s	88%	100	100	100	100	85	97%
73	Claude Sonnet 4	$0.0085	10.7s	92%	100	100	100	93	91	97%
80	Z.AI GLM 4.7 Flash	$0.0011	1.0m	92%	100	100	100	94	90	97%
43	GPT-4.1 Mini	$0.0005	3.4s	85%	100	100	100	100	82	96%
44	ByteDance Seed 1.6 Flash	$0.0007	14.5s	91%	100	100	100	91	90	96%
56	Gemma 3 4B	$0.0001	13.9s	84%	100	100	100	100	80	96%
55	GPT-5.4 Mini	$0.0018	2.3s	83%	100	100	100	100	79	96%
42	Grok 4 Fast	$0.0005	7.0s	89%	100	100	100	91	88	96%
63	Grok 4.1 Fast	$0.0006	11.6s	82%	100	100	100	100	78	96%
90	DeepSeek V4 Pro	$0.0024	42.3s	80%	100	100	100	100	75	95%
67	Qwen 3.5 Plus (2026-02-15)	$0.0019	25.9s	89%	100	94	94	93	93	95%
58	Mistral Small 4 (Reasoning)	$0.0009	12.8s	85%	100	100	100	92	81	95%
130	Claude Opus 4	$0.044	22.7s	87%	100	94	94	92	89	94%
60	Gemini 2.5 Flash Lite	$0.0006	5.1s	82%	100	100	93	92	83	94%
75	Claude Haiku 4.5	$0.0036	7.3s	82%	100	100	100	91	77	94%
71	Llama 3.1 70B	$0.0007	15.8s	81%	100	100	92	91	85	94%
69	Stealth: Healer Alpha	$0.0000	10.9s	80%	100	100	96	91	77	93%
66	GPT-4.1 Nano	$0.0001	4.9s	79%	100	100	100	90	73	93%
103	Z.AI GLM 5	$0.0055	1.2m	81%	100	94	90	88	86	92%
111	Qwen 3.5 35B	$0.015	37.5s	67%	100	100	100	96	59	91%
120	Qwen 3.5 9B	$0.0015	2.1m	64%	100	96	95	93	56	88%
131	ByteDance Seed 2.0 Mini	$0.0022	2.4m	54%	100	100	100	86	40	85%
99	Arcee AI: Trinity Large (Preview)	$0.0000	8.4s	60%	100	100	91	78	55	85%
102	Mistral Large 3	$0.0015	18.6s	61%	100	92	80	76	67	83%
121	DeepSeek V4 Flash (Reasoning)	$0.0002	10.6s	20%	100	100	100	100	0	80%
127	Mistral Large 2	$0.0042	16.8s	20%	100	100	100	100	0	80%
124	DeepSeek V3 (2024-12-26)	$0.0007	20.7s	21%	100	100	100	94	0	79%
117	Llama 3.1 8B	$0.0001	4.6s	22%	100	100	100	90	0	78%
123	Qwen 3 32B	$0.0005	17.3s	22%	100	100	100	89	0	78%
128	Writer: Palmyra X5	$0.0049	13.2s	22%	100	100	100	86	0	77%
113	Rocinante 12B	$0.0004	29.0s	41%	100	94	67	63	50	75%
114	Mistral Medium 3.1	$0.0019	16.2s	42%	100	75	67	50	50	68%
125	Ministral 8B	$0.0001	2.8s	19%	100	100	73	67	0	68%
122	Cohere Command R+ (Aug. 2024)	$0.0067	13.3s	47%	92	70	65	63	50	68%
129	Ministral 3B	$0.0000	2.3s	18%	100	100	71	50	0	64%
141	MiniMax M2.7	$0.0050	44.3s	17%	100	95	61	50	0	61%
133	Mistral NeMO	$0.0001	4.9s	2%	100	100	100	0	0	60%
126	Claude 3 Haiku	$0.0008	3.8s	29%	100	50	50	50	43	59%
136	Qwen 2.5 72B	$0.0004	20.6s	7%	100	95	85	0	0	56%
139	WizardLM 2 8x22b	$0.0008	16.2s	6%	100	100	71	0	0	54%
138	Ministral 3 8B	$0.0002	6.0s	5%	100	100	50	0	0	50%
134	Mistral Small 4	$0.0005	7.2s	17%	85	71	60	0	0	43%
142	LFM2 24B	$0.0001	11.5s	0%	100	100	0	0	0	40%
143	Mistral Small 3.2 24B	$0.0002	10.9s	0%	100	50	0	0	0	30%
140	Mistral Small Creative	$0.0004	6.2s	26%	50	50	50	0	0	30%
144	Qwen3 235B A22B Instruct 2507	$0.0004	25.2s	0%	100	0	0	0	0	20%
146	Llama 3.1 Nemotron 70B	$0.0003	24.3s	0%	44	0	0	0	0	9%
147	Ministral 3 14B	$0.0002	8.6s	0%	0	0	0	0	0	0%
145	Ministral 3 3B	$0.0001	2.5s	0%	0	0	0	0	0	0%
90.64%

Language Writing

Character dialogue (French) in a story

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)