DeepMind i Google merret me parashikimin e motit, me performancë të shkëlqyer
Sipas disa masave, sistemet e AI janë tani konkurruese me metodat tradicionale të llogaritjes për gjenerimin e parashikimeve të motit. Për shkak se trajnimi i tyre penalizon gabimet, megjithatë, parashikimet priren të bëhen “të paqarta” – ndërsa ecni më tej në kohë, modelet bëjnë më pak parashikime specifike pasi ato kanë më shumë gjasa të jenë të gabuara. Si rezultat, ju filloni të shihni gjëra të tilla si shtigjet e stuhisë që zgjerohen dhe vetë stuhitë humbasin skajet e përcaktuara qartë.
Por përdorimi i AI është ende jashtëzakonisht joshëse, sepse alternativa është një model llogaritës i qarkullimit atmosferik, i cili është jashtëzakonisht intensiv në llogaritje. Megjithatë, është shumë i suksesshëm, me modelin e ansamblit nga Qendra Evropiane për Parashikimet e Motit në Rang të Mesëm që konsiderohet më i miri në klasë.
Në një dokument që po publikohet sot, DeepMind i Google pretendon se sistemi i tij i ri i AI arrin të tejkalojë modelin evropian në parashikimet për të paktën një javë dhe shpesh më tej. Sistemi i DeepMind, i quajtur GenCast, bashkon disa qasje llogaritëse të përdorura nga shkencëtarët e atmosferës me një model difuzioni, i përdorur zakonisht në AI gjeneruese. Rezultati është një sistem që ruan rezolucion të lartë duke ulur ndjeshëm koston llogaritëse.
Metodat tradicionale llogaritëse kanë dy avantazhe kryesore mbi sistemet e AI. E para është se ato bazohen drejtpërdrejt në fizikën atmosferike, duke përfshirë rregullat që ne dimë se rregullojnë sjelljen e motit tonë aktual, dhe ata llogaritin disa nga detajet në një mënyrë që informohet drejtpërdrejt nga të dhënat empirike. Ato gjithashtu drejtohen si ansamble, që do të thotë se ekzekutohen shumë shembuj të modelit. Për shkak të natyrës kaotike të motit, këto drejtime të ndryshme gradualisht do të ndryshojnë, duke siguruar një masë të pasigurisë së parashikimit.
Të paktën një përpjekje është bërë për të bashkuar disa nga aspektet e modeleve tradicionale të motit me sistemet e AI. Një projekt i brendshëm i Google përdori një model tradicional të qarkullimit atmosferik që ndante sipërfaqen e Tokës në një rrjet qelizash, por përdorte një AI për të parashikuar sjelljen e secilës qelizë . Kjo siguroi performancë shumë më të mirë llogaritëse, por në kurriz të qelizave relativisht të mëdha të rrjetit, gjë që rezultoi në rezolucion relativisht të ulët.
Për marrjen e parashikimeve të motit me AI, DeepMind vendosi të anashkalojë fizikën dhe në vend të kësaj të adoptojë aftësinë për të drejtuar një ansambël.
Gen Cast bazohet në modelet e difuzionit, të cilat kanë një veçori kryesore që është e dobishme këtu. Në thelb, këto modele trajnohen duke i filluar me një përzierje të një modeli origjinal – imazhi, teksti, moti – dhe më pas një variacion ku injektohet zhurma. Sistemi supozohet të krijojë një variant të versionit të zhurmshëm që është më afër origjinalit. Pasi të trajnohet, mund të ushqehet me zhurmë të pastër dhe të evoluojë zhurmën për të qenë më afër çdo gjëje që synon.
Në këtë rast, objektivi janë të dhënat realiste të motit dhe sistemi merr një hyrje të zhurmës së pastër dhe e evoluon atë bazuar në gjendjen aktuale të atmosferës dhe historinë e saj të fundit. Për parashikimet me rreze më të gjatë, “historia” përfshin të dhënat aktuale dhe të dhënat e parashikuara nga parashikimet e mëparshme. Sistemi ecën përpara me hapa 12-orësh, kështu që parashikimi për ditën e tretë do të përfshijë kushtet e fillimit, historinë e mëparshme dhe dy parashikimet nga dita e parë dhe e dytë.
Kjo është e dobishme për krijimin e një parashikimi të ansamblit, sepse mund t’i jepni modele të ndryshme zhurmash si hyrje dhe secila do të prodhojë një dalje paksa të ndryshme të të dhënave të motit. Kjo i shërben të njëjtit qëllim që bën në një model tradicional të motit: sigurimin e një mase të pasigurisë për parashikimin.
Për çdo katror të rrjetit, GenCast punon me gjashtë masa të motit në sipërfaqe, së bashku me gjashtë që ndjekin gjendjen e atmosferës dhe 13 lartësi të ndryshme në të cilat vlerëson presionin e ajrit. Secili prej këtyre katrorëve të rrjetës është 0,2 gradë në një anë, një rezolucion më i lartë se sa përdor modeli evropian për parashikimet e tij. Pavarësisht këtij rezolucioni, DeepMind vlerëson se një shembull i vetëm (që do të thotë jo një ansambël i plotë) mund të mbarojë deri në 15 ditë në një nga sistemet e përpunimit të tensoreve të Google në vetëm tetë minuta.
Është e mundur të bëhet një parashikim i ansamblit duke ekzekutuar disa versione të kësaj paralelisht dhe më pas duke integruar rezultatet. Duke pasur parasysh sasinë e harduerit që Google ka në dispozicion, i gjithë procesi nga fillimi në fund ka të ngjarë të zgjasë më pak se 20 minuta. Burimi dhe të dhënat e trajnimit do të vendosen në faqen GitHub për projektin GraphCast të DeepMind. Duke pasur parasysh kërkesat relativisht të ulëta llogaritëse, ndoshta mund të presim që ekipet individuale të kërkimit akademik të fillojnë të eksperimentojnë me të.
DeepMind raporton se GenCast tejkalon në mënyrë dramatike modelin më të mirë të parashikimit tradicional. Duke përdorur një standard standard në terren, DeepMind zbuloi se GenCast ishte më i saktë se modeli evropian në 97 përqind të testeve që përdorte, të cilat kontrollonin vlera të ndryshme të prodhimit në periudha të ndryshme në të ardhmen. Gjithashtu, vlerat e besimit, bazuar në pasigurinë e marrë nga ansambli, ishin përgjithësisht të arsyeshme.
Parashikuesit e motit të inteligjencës artificiale të mëparshme, pasi janë trajnuar për të dhënat e botës reale, në përgjithësi nuk janë të mirë në trajtimin e motit ekstrem, pasi ai shfaqet kaq rrallë në grupin e trajnimit. Por GenCast bëri mjaft mirë, shpesh duke tejkaluar modelin evropian në gjëra të tilla si temperaturat anormalisht të larta dhe të ulëta dhe presioni i ajrit (frekuenca një përqind ose më pak, duke përfshirë në përqindjen 0.01).
DeepMind gjithashtu shkoi përtej testeve standarde për të përcaktuar nëse GenCast mund të jetë i dobishëm. Ky hulumtim përfshinte projektimin e gjurmëve të cikloneve tropikale, një punë e rëndësishme për modelet e parashikimit. Për katër ditët e para, GenCast ishte dukshëm më i saktë se modeli evropian dhe e ruajti avantazhin e tij për rreth një javë.
Një nga testet më interesante të DeepMind ishte kontrollimi i parashikimit global të prodhimit të energjisë së erës bazuar në informacionin nga Baza e të dhënave Global Powerplant. Kjo përfshinte përdorimin e tij për të parashikuar shpejtësinë e erës në 10 metra mbi sipërfaqe (që në fakt është më e ulët se ku ndodhen shumica e turbinave, por është përafrimi më i mirë i mundshëm) dhe më pas përdorimin e atij numri për të kuptuar se sa energji do të gjenerohej. Sistemi mundi modelin tradicional të motit me 20 për qind për dy ditët e para dhe qëndroi përpara me një ulje të epërsisë deri në një javë.
Studiuesit nuk shpenzojnë shumë kohë duke shqyrtuar pse performanca duket se bie gradualisht për rreth një javë. Idealisht, më shumë detaje rreth kufizimeve të GenCast do të ndihmonin në përmirësime të mëtejshme, kështu që studiuesit ka të ngjarë të mendojnë për të. Në çdo rast, punimi i sotëm shënon rastin e dytë ku marrja e diçkaje të ngjashme me një qasje hibride – përzierja e aspekteve të sistemeve tradicionale të parashikimit me AI – është raportuar se përmirëson parashikimet. Dhe të dyja këto raste morën qasje shumë të ndryshme, duke ngritur perspektivën se do të jetë e mundur të kombinohen disa nga veçoritë e tyre.