OpenAI และ Anthropic เปิดตัวโมเดล AI คู่แข่ง ขณะที่การแข่งขันเพื่อองค์กรร้อนแรงขึ้น

Decrypt

OpenAI และ Anthropic เปิดตัวโมเดล AI รุ่นเรือธงใหม่ในสายผลิตภัณฑ์ของตนภายในเวลาไม่ถึงชั่วโมงในวันพฤหัสบดี ซึ่งเน้นให้เห็นถึงการแข่งขันที่รุนแรงขึ้นระหว่างผู้พัฒนาชั้นนำในการครองตลาดซอฟต์แวร์สำหรับองค์กรและเครื่องมือเขียนโค้ดขั้นสูง Anthropic ประกาศ Claude Opus 4.6 โดยเน้นความก้าวหน้าในการวิเคราะห์บริบทยาวและเวิร์กโฟลว์ที่อิงตัวแทน ในขณะที่ OpenAI หลังจากนั้นไม่นานก็ปล่อย GPT-5.3 Codex ซึ่งเป็นโมเดลที่ปรับให้เหมาะสมสำหรับการเขียนโค้ดแบบอิงตัวแทนและการพัฒนาซอฟต์แวร์ การเปิดตัวพร้อมกันในเวลาสั้น ๆ นี้เน้นให้เห็นว่าคู่แข่งกำลังปรับปรุงอย่างรวดเร็ว ขณะที่บริษัทต่าง ๆ แข่งขันเพื่อให้ได้สัญญาระยะยาวกับลูกค้าบริษัทขนาดใหญ่ 

ผลการทดสอบเปรียบเทียบชี้ให้เห็นว่าโมเดลทั้งสองถูกปรับให้เหมาะสมกับจุดแข็งที่แตกต่างกัน Claude Opus 4.6 แสดงผลการทำงานที่แข็งแกร่งกว่าในงานที่เกี่ยวข้องกับการวิเคราะห์ด้านกฎหมายและการเงิน ในขณะที่ GPT-5.3 Codex ทำผลงานได้ดีกว่าในการทดสอบเขียนโค้ดแบบอิงตัวแทนและเมตริกด้านประสิทธิภาพ ตามข้อมูลที่เผยแพร่โดยทั้งสองบริษัท การเปิดตัวนี้เกิดขึ้นในขณะที่นักลงทุนกำลังประเมินแนวโน้มของผู้ให้บริการซอฟต์แวร์แบบดั้งเดิม โดยหุ้นของบริษัทด้านข้อมูลและบริการมืออาชีพหลายแห่งร่วงลงในสัปดาห์นี้ เนื่องจากความกังวลว่าแพลตฟอร์มที่เป็นนวัตกรรมด้าน AI อาจลดความต้องการเครื่องมือสำหรับองค์กรที่มีอยู่เดิม Anthropic กล่าวว่า Claude Opus 4.6 ให้ผลลัพธ์ที่ดีขึ้นในด้านการวิเคราะห์บริบทยาวและงานด้านมืออาชีพ โดยอ้างอิงถึงหน้าต่างบริบทที่รองรับ 1 ล้านโทเคน และคะแนน 76% บน MRCR v2 ซึ่งเป็นเกณฑ์มาตรฐานสำหรับการดึงข้อมูลซับซ้อน

บริษัทกล่าวว่าโมเดลนี้ยังทำผลงานได้ดีกว่าเวอร์ชันก่อนในงานด้านการเงินและกฎหมาย และได้แนะนำ “ทีมตัวแทน” ที่อนุญาตให้ AI หลายตัวทำงานพร้อมกันในการเขียนโค้ดและเอกสาร OpenAI ปล่อย GPT-5.3 Codex หลังจากนั้นไม่นาน โดยวางตำแหน่งเป็นโมเดลที่ปรับให้เหมาะสมสำหรับการเขียนโค้ดและการวิจัยแบบอิงตัวแทน OpenAI กล่าวว่า Codex ทำคะแนนได้ 77.3% บน Terminal-Bench 2.0 ซึ่งเป็นเกณฑ์มาตรฐานสำหรับการเขียนโค้ดแบบอิงตัวแทน โดย Claude Opus 4.6 ทำได้ 65.4% และสามารถทำงานให้เสร็จเร็วขึ้นในขณะที่ใช้โทเคนที่น้อยลง OpenAI ยังกล่าวว่าเวอร์ชันเบื้องต้นของ Codex ถูกใช้ภายในเพื่อช่วยแก้บั๊กในการฝึกสอนและจัดการการปรับใช้งาน ซึ่งเป็นหนึ่งในครั้งแรกที่โมเดลมีบทบาทโดยตรงในการเร่งพัฒนาของตัวเอง โดยรวม ผลลัพธ์เหล่านี้ชี้ให้เห็นว่าโมเดลทั้งสองไม่ได้มีความได้เปรียบชัดเจนในภาพรวม โดยความได้เปรียบด้านประสิทธิภาพขึ้นอยู่กับว่าบริษัทให้ความสำคัญกับการวิเคราะห์เชิงมืออาชีพหรือการพัฒนาซอฟต์แวร์อัตโนมัติ Google คาดว่าจะเปิดตัวอัปเดตโมเดล Gemini ในอีกไม่กี่เดือนข้างหน้า ในขณะที่ผู้พัฒนา AI รายอื่น เช่น DeepSeek ก็เตรียมเปิดตัวเวอร์ชันใหม่ ๆ เพิ่มความเร็วในการแข่งขันในภาคส่วนนี้ อย่างไรก็ตาม ผลการทดสอบเปรียบเทียบเพียงอย่างเดียวไม่น่าจะเป็นตัวกำหนดความเป็นผู้นำในตลาด เนื่องจากการนำไปใช้ในวงกว้างและการปรับใช้ในองค์กรมีบทบาทมากขึ้นในการกำหนดแนวการแข่งขัน ในขณะที่การแข่งขันยังคงกดดันคู่แข่งต่อไป เวลาเท่านั้นที่จะบอกได้ว่าเวิร์กโฟลว์ที่อิงตัวแทนจะกลายเป็นส่วนสำคัญของกิจกรรมทางเศรษฐกิจหรือไม่ OpenAI และ Anthropic แน่นอนว่ามุ่งหวังเช่นนั้น

ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น