Bitget App
Giao dịch thông minh hơn
Mua CryptoThị trườngGiao dịchFutures‌EarnWeb3Quảng trườngThêm
Giao dịch
Spot
Mua bán tiền điện tử
Ký quỹ
Gia tăng vốn và tối ưu hiệu quả đầu tư
Onchain
Tương tác on-chain dễ dàng với Onchain
Convert & GD khối lượng lớn
Chuyển đổi tiền điện tử chỉ với một nhấp chuột và không mất phí
Khám phá
Launchhub
Giành lợi thế sớm và bắt đầu kiếm lợi nhuận
Sao chép
Sao chép elite trader chỉ với một nhấp
Bots
Bot giao dịch AI đơn giản, nhanh chóng và đáng tin cậy
Giao dịch
USDT-M Futures
Futures thanh toán bằng USDT
USDC-M Futures
Futures thanh toán bằng USDC
Coin-M Futures
Futures thanh toán bằng tiền điện tử
Khám phá
Hướng dẫn futures
Hành trình giao dịch futures từ người mới đến chuyên gia
Chương trình ưu đãi futures
Vô vàn phần thưởng đang chờ đón
Bitget Earn
Sản phẩm kiếm tiền dễ dàng
Simple Earn
Nạp và rút tiền bất cứ lúc nào để kiếm lợi nhuận linh hoạt không rủi ro
On-chain Earn
Kiếm lợi nhuận mỗi ngày và được đảm bảo vốn
Structured Earn
Đổi mới tài chính mạnh mẽ để vượt qua biến động thị trường
Quản lý Tài sản và VIP
Dịch vụ cao cấp cho quản lý tài sản thông minh
Vay
Vay linh hoạt với mức độ an toàn vốn cao
Nhân viên OpenAI công khai cáo buộc kết quả kiểm tra chuẩn của mô hình AI mới nhất của xAI, Grok3, là gây hiểu lầm

Nhân viên OpenAI công khai cáo buộc kết quả kiểm tra chuẩn của mô hình AI mới nhất của xAI, Grok3, là gây hiểu lầm

Bitget2025/02/23 03:37
Hiển thị bản gốc

Gần đây, một nhân viên của OpenAI đã công khai cáo buộc công ty xAI của Elon Musk phát hành kết quả kiểm tra tiêu chuẩn gây hiểu lầm cho mô hình AI mới nhất của họ, Grok3. Đáp lại, Igor Babushkin, đồng sáng lập xAI, khẳng định rằng không có hành vi sai trái nào.

Biểu đồ của xAI cho thấy hai phiên bản của Grok3 - Grok3 Reasoning Beta và Grok3 mini Reasoning - đã vượt trội hơn mô hình mạnh nhất hiện có của OpenAI là o3-mini-high trên AIME 2025. Tuy nhiên, một nhân viên của OpenAI nhanh chóng chỉ ra trên nền tảng X rằng biểu đồ của xAI không bao gồm điểm số của o3-mini-high dưới điều kiện "cons@64" trong AIME 2025.

Trên nền tảng X, Babushkin lập luận rằng OpenAI cũng đã phát hành các biểu đồ tiêu chuẩn gây hiểu lầm tương tự trong quá khứ. Mặc dù những biểu đồ này được sử dụng để so sánh hiệu suất mô hình của chính họ.

0

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.
APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.
Khóa ngay!