"विश्वमा स्मार्ट" को परीक्षण गर्दै

AIPU वाचटन समूह (1)

परिचय

के तपाईंलाई लाग्छ कि क्रार्क 3 प्रि-प्रशिक्षित मोडेलको "अन्त्य बिन्दु" हुनेछ?

एलोन कंसक र Xai टोली आधिकारिक रूपमा किरावर्गको कल्पित संस्करणमा बसाईएको थियो। यस घटनाको अघि, सम्बन्धित जानकारीको एक महत्वपूर्ण रकम मांसपेशी 2 24/7 प्रमोशनल हाइपको साथ जोडीले अभूतपूर्व स्तरका लागि विश्वव्यापी अपेक्षा राख्यो। एक हप्ता पहिले, कस्तूरीले गोलस्भ्याक रि 1 मा टिप्पणी गर्ने बखत एक जैविक रुपमा भने, "एआईले उत्तम ऐ मोडल सुरू गर्न को लागी हो।" प्रस्तुत तथ्या .्कबाट आएका महामारीबाट, कर्कले कमाण्डका सबै वर्तमान मुख्य मोडेलहरू मन्त्रीहरू, विज्ञानको मंगेत्स मिसनको लागि कट्टरपन्थी कार्यहरूको लागि तीन वर्ष भित्र रहेको दाबी गरेको छ। यद्यपि यी हाल केवल कम्मरका छन्। सुरूवात पछि, मैले गेकोको पछिल्लो बेटा संस्करणको जाँच गरें र ठूलो मोडेलहरूको लागि क्लासिक ट्रिक प्रश्न सोधें: "जुन ठूलो, .1.1 वा .9 .9 हो?" अफसोस, कुनै पनि क्वालिफायर वा चिनारी बिना, तथाकथित स्पार्ट क्राइस्ट कर्क3 अझै पनि यस प्रश्नको जवाफ दिन सकेन। Kka3 प्रश्नको अर्थ सही पहिचान गर्न असफल भयो।

 

यस परीक्षणले चाँडै धेरै साथीहरूबाट पर्याप्त ध्यान आकर्षित गर्यो, र विदेशमा विभिन्न प्रकारका परीक्षणहरूले आधारभूत फिक्री वा गणितका प्रश्नहरू जस्ता गेराइ complacted ्गी टावरको साथ संघर्ष गरिरहेको छ? " तसर्थ, यो "कल्पनिक प्रश्नहरूको जवाफ दिन राजी छ भन्ने कुरा बेवयनको कुरा हानिकारक लेबल गरिएको छ।

6040

Kork3 राम्रो छ, तर यो R1 वा O1-प्रो भन्दा राम्रो छैन।

क्रालोले अभ्यासमा धेरै साझा ज्ञानको परीक्षणमा "असफलता" अनुभव गरे। एक्सई सुरुवात घटनाको अवधिमा, कम्मर 2 को चरित्र 2 को चरित्र र प्रभावहरू विश्लेषण गर्नको लागि क्राइक्सले देखाएको मस्वाले देखायो, जुन उनले प्राय: खेल्छन्। जिवेकराइममा कम्मरले यो स्पष्ट मुद्दालाई ध्यान दिएन।

 

यो गल्तीले केवल जसमा "एक विकल्प" मा नक्कल गर्न को लागी मांसपेशीहरूको लागि मात्र थप प्रमाणहरू प्रदान गरेको छैन तर व्यावहारिक अनुप्रयोगहरूमा क्राइगको विश्वसनीयताको बारेमा उल्लेखनीय चिन्ता पनि बढायो। यसको वास्तविक क्षमता जस्तो "प्रतिभावाद" को लागी, यसको विश्वसनीयता अत्यन्त जटिल अनुप्रयोग परिदृश्यहरू, जस्तै मंगल ग्रह जस्ता, शंकामा रहन्छ।

 

हाल, धेरै टायरहरू जसले क्र्क kssests हप्ता अघि पहुँच प्राप्त गरे, र हिजो केही घण्टा केही घण्टाको लागि मोडेल क्षमताहरूको परीक्षण गर्नेहरू, सबैले साझा निष्कर्षमा पुगेका छैनन्, तर यो R1 वा O1-प्रो भन्दा राम्रो छैन, तर यो उत्तम छ। "

60 600 (1)

"NVIDIA अवरोध गर्दै" मा आलोचनात्मक परिप्रेक्ष्य "

रिलीजको बेलामा आधिकारिक रूपमा प्रस्तुत गरिएको पीपीएमा, चट्टानको अमुनामा "धेरै टाढा ग्राफिक प्रविधिमा मात्र सूचीबद्ध परिणामहरू: परीक्षण परिणामहरू केवल परीक्षण परिणामहरू छन्।

6040

वास्तविक मोडेल स्कोरिंग नतीजाहरूमा, गूकि fult% dicksekk R1 र GPT-45.0 भन्दा बढि 1-2% भन्दा बढि छ, जुन व्यावहारिक परीक्षाहरूमा सम्बन्धित छ जुन "ध्यान दिएन।" होइन। Kork3 केवल 1% -2% ले आफ्नो उत्तराधिकारीहरू भन्दा बढी।

6040

यद्यपि कर्कले हाल सार्वजनिक रूपमा परिक्षण मोडेलहरू भन्दा माथिको र धेरैले यसलाई गम्भीरतापूर्वक लिएको छैन: aiai पहिले स्कोर स्कोरले "स्कोर स्कोरले" को लागी आलोचना गरिएको छ। नेश्रीबोर्डको उत्तराधिकारको उत्तराधिकारको उत्तरी अंशको रूपमा, स्कोरले ठूलो घट्यो, "उच्च स्कोरिंग तर कम क्षमता" को आलोचना गर्ने उद्योग भित्रपट्टि।

 

अगुवाबोबोर्ड "हेरफेर" वा दृष्टान्तहरूमा डिजाइन चालहरू मार्फत, उनीहरूले मोडल क्षमताहरू मा "प्याक गर्न" को धारणाको साथ Xie र कस्तूरीको धारणा प्रकट गर्छन्। कम्मरले यी मार्जिनको लागि ठाडो मूल्य तिरेको छ: उनले 200,000 एच100 gpus (100,000 "" प्रयोग गरेर जमात '10,00 लाख घण्टा प्राप्त गर्थे) र 200 मिलियन डलर घण्टा प्राप्त गर्दै। यसले कसैलाई विश्वास गर्न लगायो कि यसले जीपीओ उद्योगका अर्को महत्त्वपूर्ण बोसनलाई प्रतिनिधित्व गर्दछ र "मूर्ख" को रूपमा यस क्षेत्रमा दीर्विद्को असरलाई विचार गर्न सक्छ। होईन, केहि विश्वास गर्छन् कि सरासर कम्प्यनलनको शक्ति मोडेल प्रशिक्षणको भविष्य हुनेछ।

 

यद्यपि केही नेटन्स जनहरू 2000 H800 gpus को खपतलाई दुई महिना अगाडि दीपकक v3 उत्पादन गर्न 2 263 को वास्तविक प्रशिक्षणको खपत v3 मा 2 233 भन्दा बढीको हिसाबले गणना गरिएको छ। दीर्विटक v3 बीचको खाली ठाउँ, जुन 1 14002 अ points ्कको बीचमा, र क्राइकि five भर्खरै 100 अंक मुनि छ। यस डाटाको रिहाइको पछि, धेरैले चाँडै महसुस गरे कि "विश्वको सब भन्दा बलियो" को रूप मा एक स्पष्ट सीमान्त उपयोगी उपयोगिता प्रभावशाली छ - ठूलो मोडेलको तर्क घट्दै गएको रिटर्न देखाउनको लागि।

60 6400 (2)

"उच्च स्कोरिंग तर कम क्षमतासहित," कोर्क2 ले प्रयोग गर्न X (ट्विटर) प्लेटफर्मको उच्च-गुणवत्ता डाटाको विशाल मात्रा थियो। जे होस्, करिलको प्रशिक्षणमा XAI ले हाल अनुहारहरू जुन हाल अनुहारहरू "कि हाल अनुहारहरू" लाई अपखिकर तालिमको क्षमताले मोडेलको क्षमताहरूको पार गर्दछ।

 

गीकका विकासकर्ताहरूले सम्भवतः यी तथ्यहरूलाई बुझ्न र पहिचान गर्ने सम्भावनाहरू सम्भवतः यो हो कि संस्करण प्रयोगकर्ताहरूले अहिलेसम्मको संस्करण "र कि" पूर्ण संस्करण जारी रहनेछ। " कम्मरले ग्र्याकको उत्पादन प्रबन्धकको भूमिकालाई लिएको छ, सुझावहरूको खण्डमा सामना गर्ने विभिन्न मुद्दाहरूमा प्रतिक्रिया प्रदान गर्दछ। ऊ पृथ्वीमा उत्पादन प्रबन्धक हुन सक्छ।

 

यद्यपि, एक दिन भित्र, करिबल कम्प्यौती मांसपेशीहरू "लाई तालिमका लागि सार्वजनिक रूपमा उपलब्ध हुने आशाको लागि onchablecion प्रदर्शन outouldly उठाइएको छ: gptriply trptress0 डलर भन्दा बढी। अफवाहहरूले सुझाव दिन्छ कि GPT-4.5 को प्यारामिटर साइज ठूलो हुन सक्छ।

 

मोडेल प्यारामिटर धाराको रूपमा, प्रशिक्षण लागत पनि स्काइ्रोइकेट छ। कट्टरजनको उपस्थितिको साथ, GPT-45.5.55 र अन्यहरूसँग सम्मिलित गर्न चाहने "जलाउने मजात" जारी राख्नको लागि यसरी राम्रो मोडेल प्रदर्शनको लागि जारी राख्नुहोस् जुन अब दृष्टिमा छ र यसलाई कसरी पार गर्न सकिन्छ। यस घडीमा इलियाको सुस्तरभर, विगतका प्रमुख वैज्ञानिक, पहिले परिचित भएर भनिएको थियो, "छलफलमा पुग्ने, ठूला मोडेलहरूलाई प्रशिक्षण दिने प्रयासहरू।

60 6400 ())

इलियाको दृष्टिकोण उद्योगमा अलार्मको आवाज आएको छ। ऊ सही रूपमा पहुँचयोग्य नयाँ डेटाको आसन्न थकान पूर्वानुमान गर्नुहोस्, यस्तो अवस्था निम्त्याउन जहाँ प्रदर्शन डेटा अधिग्रहण मार्फत प्रदर्शन गर्न सकियोस्, यसलाई मन पराउने बित्तिकै यसलाई तुलना गर्नुहोस्। उनले "इन्टरनेटमा तेल, मानव-उत्पादन गरिएको सामग्री एक सीमित स्रोत हो भनेर संकेत गर्नुभयो। सुस्तरहरूको भविष्यवाणीमा, मोडेलको अर्को पुस्ता, पोस्ट-प्रि-प्रशिक्षण, "भनेको मानव मस्तिष्कजस्तै" बोल्ने क्षमताहरू "हुनेछ।

 

आजको पूर्व प्रशिक्षित मोडेलहरू विपरीत विपरीत जुन मुख्य रूपमा सामग्री मिल्दोमा निर्भर हुन्छ (पहिलेका नम्बरको मोडेलमा आधारित) विगतका मस्तिष्क "सोचाइ" मा समस्याहरू समाधान गर्न सक्षम हुनेछ। एक व्यक्तिले केवल आधारभूत व्यावसायिक साहित्यको अधीनमा रहेको आधारभूत प्रवीणता हासिल गर्न सक्दछ, जबकि AI ठूलो मोडेलले केवल सबै आधारभूत प्रविष्टि-स्तरीय प्रभावकारिता प्राप्त गर्न लाखौं डाटा पोइन्टहरू आवश्यक पर्दछ। जब यो शब्द थोरै परिवर्तन हुन्छ, यी आधारभूत प्रश्नहरू सही रूपमा बुझिदैनन्, लेखको सुरूमा, मोडेलमा उल्लेखित आधारभूत अझै उमेर अझै यस घटनाले स्पष्ट उदाहरणको प्रतिनिधित्व गर्दछ।

微信图片 _220264022222341.jpg1

निष्कर्ष

यद्यपि, जैट्रश्वर पछाडि, यदि सरकारले "पूर्व प्रशिक्षित मोडेलहरू" उद्योगको अन्त्यमा पुग्दा वास्तवमा खुलासा गर्न सफल हुन्छ भने, "यसले मैदानको लागि महत्वपूर्ण प्रभाव पार्दछ।

उन्मादरको फ्रिकीको फ्रिकीबाट बिस्तारै कठिन भएपछि हामी यो साक्षी हुनेछौं, "$ 50 को लागि एक खास डाटासेटमा ट्यूटल मोडेलहरू जस्तै", अन्ततः agi लाई साँचो मार्ग पत्ता लगाउँदछ।

ELV केबल समाधान खोज्नुहोस्

कन्ट्रोल कन्ट्रोलहरू

BMS को लागि, बस, औद्योगिक, उपकरण केबल केबल।

संरचित क्याबिलिंग प्रणाली

नेटवर्क र डाटा, फाइबर-अप्टिक केबल, प्याच कर्ड, मोड्युल, फेसप्लेटहरू

20224 प्रदर्शनहरू र घटनाहरूको समीक्षा

अप्रिल।

एपीआर.16th -th-18, 202246 मस्कोमा

मे .99 औं, 2024 नयाँ उत्पादनहरू र टेक्नोलोजी श ga ्घीमा घटना सुरूवात गर्दछ

अक्टुबर .2222 औंठी, बेइजि in मा 0224 सुरक्षा चीन

नोभे .19-20, 2024 जडित विश्व KSA


पोष्ट समय: फेब्रुअरी-1 -22225