"Meta Charset Tag" HTML5

Rašmenų kodavimo nustatymas HTML5

Prieš įdiegiant HTML5, nustatykite simbolio kodavimą dokumente, naudodami elementą, norėdami parašyti šiek tiek išsamią eilutę, parodytą žemiau. Tai elementai "Meta Charset", jei naudojate HTML4 savo tinklalapyje:

Svarbu pastebėti šį kodą kableliai, kuriuos matote aplink turinio atributą: content = " text / html; charset = iso-8859-1 " . Kaip ir visi HTML atributai, šie kabutės apibrėžia atributo reikšmę, nurodant, kad visas string tekstas / html; charset = iso-8959-1 yra šio elemento turinys . Tai tinkamas HTML ir tai, kaip ši eilutė turėjo būti parašyta. Tai taip pat sudėtinga ilgai ir bjauriai! Tai taip pat nėra kažkas, ko galbūt nepamirštumėtės virš galvos! Daugeliu atvejų žiniatinklio kūrėjai turėtų kopijuoti ir įklijuoti šį kodą iš vienos svetainės į bet kurį naują, kurį jie kuria, nes daug rašė apie tai rašyti iš naujo.

"HTML5" išskiria papildomus elementus & # 34;

HTML5 ne tik pridėjo keletą naujų elementų į kalbą, bet ir labai supaprastino daugelį HTML sintaksės, įskaitant elementą "Meta Charset". HTML5, galite pridėti savo simbolių kodavimą su žymiai lengviau prisimenu META elemento sintaksę, kuri matote žemiau:

Palyginkite supaprastintą sintaksę su tuo, ką parašėme šio straipsnio pradžioje, seną HTML4 sintaksės sintaksę, ir pamatysite, kaip lengviau rašyti ir prisiminti HTML5 versiją. Vietoj to, kad reikia nukopijuoti ir įklijuoti jį iš esamos svetainės į bet kurį kitą, kuriame dirbote, tai yra visiškai kažkas, kad galėtumėte prisiminti kaip internetinį kūrėją. Šios laiko sutaupymo daugeliu atvejų nėra daug, bet kai atsižvelgsite į kitas HTML5 supaprastintas sintaksės sritis, sutaupysite!

Visada įtraukite simbolių kodavimą

Visada turėtumėte įtraukti savo tinklalapių simbolių kodavimą, net jei jūs kada nors ketinate naudoti specialius simbolius . Jei neįtraukiate simbolių kodavimo, jūsų svetainė tampa pažeidžiama kryžminio skenavimo scenarijų atakai naudojant UTF-7.

Šiame scenarijuje anattackeris mato, kad jūsų svetainėje nėra apibrėžta simbolių kodavimo, taigi triukas verčia naršyklę manyti, kad puslapio simbolių kodavimas iš tiesų yra UTF-7. Be to, užpuolikas injekuoja UTF-7 koduotus scenarijus į tinklalapį ir jūsų svetainė yra įsilaužta. Tai akivaizdžiai kelia problemų visiems, nuo jūsų įmonės iki jūsų lankytojų. Geros naujienos yra tai, kad paprasta išvengti problemos - tiesiog būtinai pridedate simbolių kodavimą visose jūsų tinklalapiuose.

Kur pridėti simbolių kodavimą

Kodas, užkoduojantis tinklalapiui, turėtų būti pirmoji jūsų HTML elemento elemento eilutė. Tai užtikrina, kad naršyklė žinotų, kas yra simbolių kodavimas prieš tai, kai jis daro ką nors kitur kitur, nei nustatyti datos tipą ir nustatyti, kad jis yra HTML puslapis. Jūsų HTML turėtų būti:

...

Naudojant HTTP antraštes papildomam saugumui

Taip pat galite nurodyti simbolių kodavimą HTTP antraštėse. Tai dar labiau saugu nei pridėti jį prie HTML puslapio, tačiau jums reikės turėti prieigą prie serverio konfigūracijų arba .htaccess failų, o tai reiškia, kad jums gali prireikti dirbti su savo svetainės prieglobos paslaugų teikėju, norint gauti tokio pobūdžio prieigą arba padaryti ją pakeitimai jums. Prieiga yra tikrai iššūkis. Pati pakeitimas yra paprastas, todėl bet kuris prieglobos paslaugų teikėjas turėtų sugebėti padaryti šį pakeitimą jūsų santykinai lengvai.

Jei naudojate "Apache", galite nustatyti numatytąjį visų jūsų svetainės simbolių rinkinį pridėdami: " AddDefaultCharset UTF-8" prie savo šakninio .htaccess failo. Apache numatytojo simbolių rinkinys yra ISO-8859-1 .