Klientët e Booking.com e mësojnë me të vështirë se Unicode është i ndërlikuar

foto

Është e lehtë të ngatërrosh një “l” me një “1” ose një “I” me një lloj tipi të dizenjuar keq. Për fat të mirë, fontet moderne kanë tendencë të përdorin një sërë teknikash për të qartësuar ato karaktere alfanumerike që ngatërrohen lehtë. Por këto dizajne rrallë marrin parasysh paqartësinë që rezulton nga ngjashmëritë në grupe të ndryshme karakteresh, siç tregon një fushatë e kohëve të fundit phishing që synon përdoruesit e Booking.com.

foto

BleepingComputer raportoi se “sulmi, i vërejtur për herë të parë nga studiuesi i sigurisë JAMESWT, abuzon me karakterin japonez hiragana ‘ん’ (Unicode U+3093), i cili i ngjan shumë sekuencës së shkronjave latine ‘/n’ ose ‘/~’, me një shikim të shpejtë në disa fonte.” Shpresa e sulmuesit është që njerëzit ta anashkalojnë karakterin e çuditshëm, të ndjekin lidhjen keqdashëse dhe më pas të bien pre e malware-it që po shpërndajnë nëpërmjet kësaj fushate.

foto

Unicode është shfrytëzuar në këtë mënyrë shumë herë më parë—kjo është një mënyrë relativisht e zakonshme për dërguesit e spamit për të kapërcyer filtrat e email-eve, për shembull, ose për troll-ë veçanërisht të përkushtuar për të ngacmuar njerëzit në internet pavarësisht mbizotërimit të filtrave të fjalëve të pista. Megjithatë, mbetet një problem i vështirë për t’u zgjidhur sepse interpretimi i tekstit, ashtu si DNS, është më i mallkuar nga sa e kuptojnë shumica e njerëzve. Pra, le të kalojmë nëpër një kurs intensiv mbi karakteret.

Fillimisht, kompjuterët mbështetën Kodin Standard Amerikan minimal për Shkëmbimin e Informacionit – ose, siç e quajnë njerëzit e shëndoshë, standardin ASCII. Kjo ishte relativisht e thjeshtë: u lejonte kompjuterëve të merreshin me 26 shkronjat e alfabetit anglez si në formën e tyre të vogël ashtu edhe në atë të madhe, një sasi të vogël shenjash pikësimi kritike dhe kode të ndryshme kontrolli që i tregonin kompjuterit se kur të vizatonte një vijë të re, të bënte një indent teksti etj.

Por doli që as perandoria britanike nuk mundi ta bënte alfabetin anglez të vetmin grup karakteresh në planet, dhe disa nga njerëzit që përdorin këto karaktere donin të përdornin edhe kompjuterë. Kjo çoi në krijimin e standardit Unicode, i cili përdoret për të koduar karakteret në çdo pajisje moderne. (Le të mos hyjmë në kodimin aktual që është UTF-8 në të gjitha sistemet e ndjeshme, ose, më konkretisht, sistemet jo-Windows.)

Konsorciumi Unicode thotë se Unicode “mund të kodojë deri në afërsisht 1.1 milion karaktere, duke i lejuar asaj të mbështesë të gjitha gjuhët dhe shkrimet e botës në një standard të vetëm universal” dhe se “të gjitha sistemet operative moderne, mjediset kompjuterike, gjuhët e programimit dhe aplikacionet mbështesin thelbin e Standardit Unicode”. Pra, mund të kemi gjëra interesante si emoji, shenja pikësimi dhe shkronja jo-angleze.

Mund të kemi edhe sulme si ai që synon përdoruesit e Booking.com, dhe parandalimi i tyre nuk është i lehtë. Një sistem operativ, shfletues etj., di si të trajtojë karakteret Unicode, por kjo nuk do të thotë se mund të përcaktojë kur një karakter po përdoret në mënyrë mashtruese. Ndonjëherë njerëzit duan të përdorin grupe karakteresh të përziera për të komunikuar në mënyrë efektive; ndonjëherë ata thjesht duan ta bëjnë diçka të duket interesante.

Vetëm për ta theksuar idenë se ky nuk është një problem i lehtë për t’u zgjidhur: Unicode e bën të vështirë arritjen e gjërave në dukje bazike, si numërimi i karaktereve në një fragment të caktuar teksti, për shembull, ose përcaktimi nëse dy karaktere janë të rreshtuara vizualisht. Kjo nuk do të thotë që adresimi i këtij problemi është i pamundur, por dyshoj se është shumë më i ndërlikuar nga sa do të prisnin shumica e njerëzve.

Sa i përket asaj që njerëzit mund të bëjnë për të shmangur rënien pre e skemave si kjo që synojnë përdoruesit e Booking.com, rekomandimi im zyrtar është që të mos lexoni kurrë email-et tuaja ose të mos klikoni në lidhje. Përveç nëse u duhen shpjegime edhe më të hollësishme se pse interpretimi (dhe redaktimi !) i tekstit është i mallkuar. Pastaj, me çdo kusht, klikoni larg. Asgjë e keqe me pak njohuri të mallkuar, ose të paktën kjo është ajo që i them vetes kur përpiqem të fle natën.