Anthropic ra mắt Claude Opus 4.7: Mô hình AI mạnh nhất với khả năng tự chủ vượt trội

Claude Opus 4.7 ra mắt với khả năng tự chủ đỉnh cao, hỗ trợ lập trình và đa phương thức. Tìm hiểu chi tiết về tính năng và hiệu suất của siêu phẩm từ Anthropic.

Anthropic vừa chính thức phát hành Claude Opus 4.7, phiên bản kế nhiệm đầy ấn tượng cho dòng mô hình cao cấp nhất của hãng. Điểm nhấn lớn nhất trong lần ra mắt này chính là khả năng tự chủ (autonomy), cho phép AI xử lý các tác vụ lập trình phức tạp và quy trình làm việc kéo dài mà không cần sự giám sát liên tục từ con người. Dù Anthropic tiết lộ sự tồn tại của mô hình nội bộ mang tên Mythos Preview với hiệu suất cao hơn, nhưng hiện tại, Opus 4.7 chính là “đỉnh cao” mà người dùng phổ thông và doanh nghiệp có thể tiếp cận rộng rãi.

Trong đợt nâng cấp này, Claude Opus 4.7 không chỉ cải thiện về trí tuệ thuần túy mà còn tối ưu hóa mạnh mẽ khả năng tương tác với hệ thống tệp tin và thực thi công cụ. Bài viết sẽ phân tích chi tiết những cải tiến về khả năng thực thi chỉ thị, hỗ trợ đa phương thức và kết quả từ các bài kiểm tra thực tế để bạn có cái nhìn khách quan nhất về sức mạnh của mô hình này so với các đối thủ như GPT-5.4 hay Gemini 3.1.

Bản chất của Claude Opus 4.7

Claude Opus 4.7 là mô hình ngôn ngữ lớn (LLM) hàng đầu của Anthropic, đứng trên các dòng Sonnet và Haiku trong hệ sinh thái Claude. Được xây dựng để giải quyết những thách thức khắt khe nhất, phiên bản này tập trung vào các quy trình làm việc có tính tác nhân (agentic workflows) và suy luận đa bước. So với người tiền nhiệm Opus 4.6, sự thay đổi lớn nhất nằm ở ba trụ cột: lập trình có tính tác nhân, suy luận hình ảnh và hiệu suất sử dụng công cụ ở quy mô lớn.

Đáng chú ý, Opus 4.7 được coi là một biến thể an toàn hơn của dòng Mythos. Trong khi Mythos vẫn đang được giữ lại để kiểm tra các biện pháp bảo vệ an ninh mạng (cyber safeguards), Opus 4.7 đã sẵn sàng để triển khai thực tế. Đây là nỗ lực của Anthropic nhằm cân bằng giữa sức mạnh tính toán vượt trội và tính an toàn cần thiết cho môi trường sản xuất của doanh nghiệp.

Những cải tiến đột phá về tính năng

Cải tiến đầu tiên phải kể đến là khả năng tuân thủ chỉ thị (instruction following). Opus 4.7 bám sát các yêu cầu chi tiết hơn bất kỳ phiên bản nào trước đó. Điều này giúp tăng độ tin cậy cho các quy trình tự động, nhưng cũng yêu cầu người dùng phải tinh chỉnh lại các câu lệnh (prompts) cũ vì mô hình hiện tại sẽ hiểu mọi hướng dẫn theo nghĩa đen một cách tuyệt đối, thay vì diễn đạt lỏng lẻo như trước.

Khả năng đa phương thức (multimodal) cũng được nâng cấp mạnh mẽ khi hỗ trợ hình ảnh có độ phân giải lên tới 3,75 megapixels, cao gấp ba lần so với các mô hình cũ. Ngoài ra, tính năng bộ nhớ (memory) dựa trên hệ thống tệp tin đã được tối ưu hóa. Trong môi trường như Claude Code, AI có thể tự ghi chép lại các quyết định vào tệp CLAUDE.md và truy xuất chính xác trong các phiên làm việc sau, giúp giảm bớt ngữ cảnh cần cung cấp ban đầu và tăng hiệu suất làm việc dài hạn.

Kết quả thử nghiệm thực tế

Trong các bài kiểm tra về tuân thủ chỉ thị với 12 ràng buộc khắt khe (bao gồm số lượng đoạn văn, từ ngữ cấm, định dạng và đếm từ), Opus 4.7 đạt điểm số ấn tượng 11/12. Lỗi duy nhất nằm ở việc vượt quá giới hạn từ ngữ một khoảng rất nhỏ, nhưng vẫn cho thấy sự tiến bộ rõ rệt so với Sonnet 4.6 vốn thường xuyên viết quá dài so với yêu cầu. Khả năng kiểm soát cấu trúc văn bản của Opus 4.7 mang lại sự yên tâm cho các công việc đòi hỏi độ chính xác cao như soạn thảo văn bản pháp lý hoặc báo cáo tài chính.

Về khả năng xử lý hình ảnh, khi được cung cấp một biểu đồ lịch sử có độ phân giải thấp và bị mờ, Opus 4.7 đã trích xuất dữ liệu với độ chính xác kinh ngạc. Nó nhận diện đúng các trục tọa độ có bước nhảy không đều và đọc được các chú thích nhỏ nhất. Dưới đây là bảng so sánh khả năng thực hiện nhiệm vụ giữa các phiên bản:

Tiêu chí Claude Opus 4.6 Claude Opus 4.7
Tuân thủ chỉ thị Khá Xuất sắc
Độ phân giải ảnh tối đa 1.2 MP 3.75 MP
Bộ nhớ phiên làm việc Cơ bản Nâng cao (Ghi chép tệp)

Hiệu suất qua các chỉ số Benchmark

Trên bảng xếp hạng SWE-bench Pro, một bài kiểm tra khả năng giải quyết các vấn đề lập trình thực tế trên GitHub, Opus 4.7 đạt 64,3%, vượt xa GPT-5.4 (57,7%) và Gemini 3.1 Pro (54,2%). Đây là mức tăng trưởng hơn 10 điểm phần trăm so với phiên bản 4.6, khẳng định vị thế dẫn đầu của Anthropic trong lĩnh vực AI hỗ trợ lập trình.

  • Suy luận cấp độ sau đại học: Đạt trên 90% trong bài kiểm tra GPQA-Diamond.
  • Phân tích tài chính: Đứng đầu bảng xếp hạng Finance Agent v1.1 với 64,4%.
  • Thị giác máy tính: Cải thiện 13 điểm phần trăm trong khả năng suy luận biểu đồ khoa học (CharXiv).
  • Sử dụng công cụ: Dẫn đầu trong MCP-Atlas với số điểm 77,3%, cho thấy khả năng điều phối nhiều công cụ cùng lúc rất mượt mà.

Cách thức tiếp cận và chính sách giá

Anthropic không để người dùng phải chờ đợi khi triển khai Opus 4.7 đồng loạt trên nhiều nền tảng. Hiện tại, bạn có thể truy cập mô hình này thông qua các kênh chính thức sau: 1. Giao diện web và ứng dụng Claude.ai. 2. Claude API với tên định danh `claude-opus-4-7`. 3. Các nền tảng đám mây đối tác như Amazon Bedrock, Google Cloud Vertex AIMicrosoft Foundry.

Về chi phí, Anthropic quyết định giữ nguyên mức giá cũ bất chấp những nâng cấp mạnh mẽ. Cụ thể, mức phí là 5 USD cho mỗi 1 triệu token đầu vào25 USD cho mỗi 1 triệu token đầu ra. Cần lưu ý rằng Opus có chi phí vận hành cao gấp khoảng 5 lần so với dòng Sonnet, do đó nó phù hợp nhất cho các tác vụ quan trọng đòi hỏi trí tuệ cao nhất thay vì các câu hỏi hội thoại thông thường.

Các công cụ đi kèm mới ra mắt

Cùng với Opus 4.7, Anthropic cũng giới thiệu mức nỗ lực xhigh (extra high) mới, nằm giữa mức high và max, cho phép người dùng tùy chỉnh sâu hơn giữa độ sâu suy luận và tốc độ phản hồi. Trong công cụ Claude Code, lệnh `/ultrareview` đã xuất hiện, cho phép AI thực hiện một bước kiểm tra chuyên sâu để phát hiện các lỗi thiết kế hoặc lỗ hổng logic mà ngay cả người thẩm định có kinh nghiệm cũng dễ bỏ sót.

Đối với người dùng doanh nghiệp và lập trình viên sử dụng API, tính năng Task budgets (ngân sách tác vụ) đang ở giai đoạn thử nghiệm beta. Tính năng này cực kỳ hữu ích để kiểm soát chi phí cho các luồng công việc tự động kéo dài, ngăn chặn tình trạng mô hình tiêu tốn quá nhiều token ngoài ý muốn. Ngoài ra, chế độ Auto mode dành cho người dùng gói Max cho phép Claude tự đưa ra một số quyết định thực thi mà không cần chờ phê duyệt từng bước, giúp đẩy nhanh tiến độ công việc.

So sánh Claude Opus 4.7 và GPT-5.4

Cuộc đối đầu giữa Opus 4.7 và GPT-5.4 cho thấy sự phân hóa rõ rệt về mục đích sử dụng. Trong khi Opus 4.7 tối ưu cho các tác vụ tự chủ dài hạn và lập trình chuyên sâu, GPT-5.4 lại thể hiện thế mạnh ở khả năng nghiên cứu trình duyệt và các tác vụ có ngữ cảnh ngắn với chi phí linh hoạt hơn cho các phiên làm việc dưới 272K token.

Đặc điểm Claude Opus 4.7 GPT-5.4
Thế mạnh lớn nhất Lập trình tác nhân, thị giác máy tính Nghiên cứu web, điều hướng phản hồi
Điểm SWE-bench Pro 64,3% 57,7%
Khả năng tự chủ Rất cao (Computer Use) Cao
Cửa sổ ngữ cảnh ~1 triệu token ~1 triệu token

Claude Opus 4.7 hiện là mô hình AI mạnh mẽ và toàn diện nhất mà người dùng có thể trải nghiệm thực tế để giải quyết các bài toán kinh doanh và kỹ thuật phức tạp. Với sự kết hợp giữa khả năng tự chủ vượt trội, bộ nhớ phiên làm việc thông minh và độ chính xác trong suy luận hình ảnh, đây là công cụ đắc lực cho những ai đang xây dựng hệ thống AI Agent thế hệ mới; bạn nên bắt đầu thử nghiệm Opus 4.7 ngay hôm nay để tối ưu hóa quy trình vận hành của mình.

Câu hỏi thường gặp

1. Claude Opus 4.7 có đắt hơn phiên bản trước không?

Không, Anthropic giữ nguyên mức giá 5 USD/1M token đầu vào và 25 USD/1M token đầu ra, tương đương với phiên bản Opus 4.6.

2. Tôi có thể sử dụng Opus 4.7 để lập trình không?

Có, đây là thế mạnh lớn nhất của mô hình này. Với điểm số dẫn đầu trên SWE-bench Pro, Opus 4.7 xử lý các lỗi phần mềm và xây dựng tính năng mới hiệu quả hơn hầu hết các đối thủ hiện nay.

3. Mô hình Mythos Preview là gì và nó có khác Opus 4.7 không?

Mythos Preview là mô hình nội bộ mạnh hơn của Anthropic nhưng chưa được phát hành rộng rãi vì lý do an toàn mạng. Opus 4.7 có thể coi là phiên bản thương mại mạnh nhất, kế thừa hầu hết sức mạnh từ dòng Mythos.

Share your love
Gọi ngay Chat