凹头man的GPT5咋样

wumingshi

我看到有些人说在专业水平上确实展现出了博士及以上水平，想看看例子，目前没看到例子
我又没有能问出博士问题并且评价博士水平回答的水平（

wumingshi

目前我想到的一个有点测试它自指能力的问题是，让它生成一个「prompt 增强器」，可以用于优化已有的 prompt
感觉它给我的回复不是很让我满意。。。。

lemma_

还没用过gpt5，不过曾经问过deepseek一些研究生级别的数理问题，答案正确率和幻觉率都相当堪忧，把互联网上的答案组织起来倒是有一手。我会多关注一下身边人对gpt5数理能力的评价。

wumingshi

@lemma_ ds倒不奇怪，本来也只是说明了「小算力通过优化有可能取得原本大家以为无法达到的水平」而已，但是在逻辑推导方面确实很糟糕（应该说很多方面都很糟糕？）

lemma_

@wumingshi 不清楚原因，觉得有可能是目前高级课程的训练语料不够，导致不足以堆出高正确率（？）