Bitget App

Giao dịch thông minh hơn

Nhân viên OpenAI công khai cáo buộc kết quả kiểm tra chuẩn của mô hình AI mới nhất của xAI, Grok3, là gây hiểu lầm

Nhân viên OpenAI công khai cáo buộc kết quả kiểm tra chuẩn của mô hình AI mới nhất của xAI, Grok3, là gây hiểu lầm

Bitget2025/02/23 03:37

Hiển thị bản gốc

Gần đây, một nhân viên của OpenAI đã công khai cáo buộc công ty xAI của Elon Musk phát hành kết quả kiểm tra tiêu chuẩn gây hiểu lầm cho mô hình AI mới nhất của họ, Grok3. Đáp lại, Igor Babushkin, đồng sáng lập xAI, khẳng định rằng không có hành vi sai trái nào.

Biểu đồ của xAI cho thấy hai phiên bản của Grok3 - Grok3 Reasoning Beta và Grok3 mini Reasoning - đã vượt trội hơn mô hình mạnh nhất hiện có của OpenAI là o3-mini-high trên AIME 2025. Tuy nhiên, một nhân viên của OpenAI nhanh chóng chỉ ra trên nền tảng X rằng biểu đồ của xAI không bao gồm điểm số của o3-mini-high dưới điều kiện "cons@64" trong AIME 2025.

Trên nền tảng X, Babushkin lập luận rằng OpenAI cũng đã phát hành các biểu đồ tiêu chuẩn gây hiểu lầm tương tự trong quá khứ. Mặc dù những biểu đồ này được sử dụng để so sánh hiệu suất mô hình của chính họ.

0

0

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.

APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.

Bạn cũng có thể thích

Nhà phân tích của Benchmark tái khẳng định xếp hạng "Mua vào" đối với công ty tiền mã hóa Nhật Bản Metaplanet

金色财经•2025/09/25 03:09

Lệnh long ETH và PUMP của Maji Dage trên Hyperliquid đang lỗ tạm thời 18,68 triệu USD.

金色财经•2025/09/25 02:51

Lệnh long ETH và PUMP của Maji Dage trên Hyperliquid đang lỗ tạm thời 18,68 triệu USD.

GAIN chính thức: Đang điều tra vấn đề liên quan đến việc phát hành thêm bất thường

金色财经•2025/09/25 02:29

Dữ liệu: 10 địa chỉ đã nhận tổng cộng 210,000 ETH trong vòng 6 giờ, trị giá khoảng 863 millions USD.

Chaincatcher•2025/09/25 02:28

Thịnh hành

Nhà phân tích của Benchmark tái khẳng định xếp hạng "Mua vào" đối với công ty tiền mã hóa Nhật Bản Metaplanet

Lệnh long ETH và PUMP của Maji Dage trên Hyperliquid đang lỗ tạm thời 18,68 triệu USD.

Giá tiền điện tử

Hướng dẫn cách bán PI

Bitget niêm yết PI - Mua bán PI nhanh chóng trên Bitget!

Giao dịch ngay

Bạn chưa có tài khoản Bitget?Gói chào mừng trị giá 6200 USDT dành cho người dùng mới của Bitget!

Đăng ký ngay

Về Bitget

Về Bitget Liên hệ chúng tôi Cộng đồng Nghề nghiệp Học viện Bitget Bitget Blog Bitget Token (BGB) Trung tâm Thông báo Bằng chứng Dự trữ Quỹ Bảo Vệ Link đối ứng Quan hệ đối tác LALIGA Quan hệ đối tác MotoGP Blockchain4Youth Blockchain4Her Sitemap

Sản phẩm

Spot Futures Onchain Cổ phiếu Ký quỹ ‌Earn Giao dịch sao chép spot Giao dịch sao chép futures Giao dịch sao chép bot Bot API TraderPro Ví Web3 OTC Fiat Bitget Swap Trung tâm Ứng dụng Telegram Trung tâm Ứng dụng Discord Thư viện Airdrop

Hỗ trợ

Gửi phản hồi Trung tâm Trợ giúp Xác minh kênh chính thức Trung tâm chống lừa đảo Đăng ký niêm yết Dịch vụ VIP Chương trình Affiliate Dịch vụ tổ chức Lưu ký tài sản Tải dữ liệu Ưu đãi Chương trình giới thiệu Biểu phí API nộp thuế

Pháp lý

Yêu cầu thực thi pháp luật Yêu cầu theo quy định Tuân thủ Giấy phép hoạt động Chính sách AML/CFT Chính sách quyền riêng tư Điều khoản Dịch vụ Công bố rủi ro

Tải APP

© 2025 Bitget