騰訊混元正式推出自研深度思考模型混元T1正式版。在體現推理模型基礎能力的常見benchmark上,如大語言模型評估增強數據集MMLU-PRO中,混元T1取得87.2分,僅次于o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基準測試中,混元T1的成績也達到業界領先推理模型的水平。