Co to jest meta charset?

Zestaw znaków, pełna nazwa to zestaw znaków rozpoznawanych przez komputer w taki sam sposób, jak kalkulator może rozpoznawać liczby. Każdy z tych znaków jest reprezentowany przez liczbę znaną jako punkt kodowy i tworzy to kanał komunikacyjny do kodowania i dekodowania treści.

Zestaw znaków zawiera więc znaki, które służą określonemu lub konkretnemu celowi. Komputer przechowuje znaki jako jeden lub więcej bajtów. Przykładem jest zestaw znaków ASCII, który reprezentuje wszystkie angielskie znaki i specjalne znaki kontrolne za pomocą liczb od 0 do 127.

Jednak większość zestawów znaków działa tylko dla określonych języków i rozpoznaje ograniczoną liczbę znaków, co sprawia, że kodowanie i zakodowanie jest trudne lub niemożliwe. W nowoczesnych czasach jednak Unicode jest najbardziej niezawodnym i powszechnie akceptowanym zestawem znaków ze względu na jego zdolność do łatwego tłumaczenia kodów i liczb.

Możesz zobaczyć meta charset w nagłówku twojego kodu html

<meta charset="utf-8>

Jak to działa?

Meta Charset to to, co określa, jak tekst jest przesyłany i przechowywany. Dane tekstowe są zazwyczaj najpierw konwertowane na postać binarną, a następnie potrzebny jest rodzaj szyfru, który łączy znaki z ich poprawnymi odpowiednikami binarnymi.

Kiedy te dane zostaną ostatecznie zdekodowane, kodowanie znaków musi być znane wcześniej, w przeciwnym razie mogą wystąpić komplikacje. Przykład tego można zobaczyć w przeglądarkach, kiedy patrzysz na stronę internetową. Informacje o rodzaju używanego zestawu znaków pochodzą z serwera lub są bezpośrednio wpisane przez programistę. Niestety, istnieje mnóstwo zestawów znaków i oznacza to różnorodne sposoby dopasowywania kodów binarnych do znaków i bajtów.

Dla twórców treści i autorów, wybór zestawu znaków UTF-8 dla swojej zawartości oznacza, że można użyć jednego zestawu znaków do wielu potrzeb związanych z znakami, co znacznie upraszcza sprawy bez konieczności śledzenia i konwertowania wielokrotnie. Oznacza to, że przeglądanie twojej zawartości będzie łatwiejsze bez wpadania na mylące znaki i śmieci

AddType 'text/html; charset=UTF-8' html

Dlaczego jest to ważne?

Kiedy pomyślisz o tym, że za każdym razem, gdy tekst jest przesyłany, musi być zakodowany w określonym zestawie znaków i odkodowany po drugiej stronie, znaczenie zestawu znaków jest dość oczywiste. Oznacza to, że bez odpowiedniego kodowania znaków, przeglądarka wyświetli śmieciowy tekst, ponieważ po prostu nie rozumie, co jest do niej wprowadzane i musi dokonać szybkiego, niepoinformowanego zgadnięcia.

Jest to również ważne w formularzach html, ponieważ gdy wprowadzasz tekst do pól tekstowych na stronach lub platformach społecznościowych, musi być on zakodowany ostrożnie. Jeśli te informacje są z jakiegoś powodu niedostępne, nieprawidłowe mapowanie może prowadzić do utraty istotnych informacji.

Przykład kodu Charset

Jaki zestaw znaków robi, to dostarcza klucz do odblokowania i złamania kodu, który przekazywany jest między użytkownikiem a stroną internetową.

To jest zestaw strukturalnych mapowań między bajtami w komputerze a znakami w zestawie znaków. Jeśli ten klucz jest brakujący, dane wyglądają jak napisane śmieci. To oznacza, że kiedy wprowadzasz tekst przez klawiaturę, zestaw znaków łączy wybrane przez ciebie znaki ze specyficznymi bajtami w pamięci komputera, a następnie do wyświetlenia tekstu odczytuje bajty z powrotem na znaki.

Czy to czynnik rankingowy dla SEO?

Zestaw znaków nie jest czynnikiem rankingowym dla optymalizacji pod kątem wyszukiwarek. Większość wyszukiwarek skupia się na ważnym celu dostarczania odpowiednich, użytecznych treści osobom, które ich szukają i jako takie nie bierze pod uwagę innych zewnętrznych czynników, które nie przyczyniają się do tego celu.

Więc zestaw znaków ma znaczenie ze względu na sposób przesyłania informacji, ale wyszukiwarki nie są tym zainteresowane. Używanie innych zestawów znaków niż Utf-8 nie obniży Twojego rankingu SEO, ponieważ w dużym stopniu nie ma znaczenia, jakiego kodowania znaków używasz, dopóki wyszukiwarka jest w stanie dostarczyć informacje użytkownikom końcowym.

Jak mogę to dodać, jeśli potrzebuję?

Możesz dodać zestaw znaków do swojej strony internetowej, używając poniższego kodu

<?phpheader( Content-Type: text/html; charset=iso-8859-1’)

Aby to działało, powinieneś to uwzględnić w PHP, który zawiera twój plik html. Ważne jest, aby zauważyć, że może to nie działać na wszystkich stronach internetowych, ponieważ powyższy kod nie jest funkcją, ale instrukcją, więc powinieneś dołączyć swój html strony. Należy to mieć na uwadze, biorąc pod uwagę, że strona internetowa w PHP używa zestawu znaków Utf-8 w swoim nagłówku.

Różne rodzaje zestawów znaków

Większość zestawów znaków powstała w wyniku działań poszczególnych producentów, którzy dostosowywali się do potrzeb swoich klientów. Większość zestawów znaków jest ze sobą niekompatybilna (z kilkoma wyjątkami). Trzy najpopularniejsze zestawy znaków to ASCII (1968), ISO 8859-1 (1987) oraz UTF-8 (1996).

ASCII

Zestaw znaków dla języka angielskiego. Zawiera 7-bitów, które są przypisane do 128 znaków. Każdej literze przypisany jest numer od 0 do 127. Ten zestaw kodów jest dość ograniczony, ale będąc jednym z pionierów, zainspirował stworzenie zestawu znaków dla każdego z innych języków. Większość komputerów używa kodów ASCII do reprezentowania tekstu.

tabela znaków ascii

Unicode

Unicode został stworzony, aby ujednolicić 135 współczesnych i historycznych języków pod jednym standardem. Unicode to standard, a nie sam zestaw znaków. Stan na maj 2019, wersja 12.1, Unicode zawiera 137,994 znaków, w tym symbole i emotikony. Standard Unicode definiuje UTF-8, UTF-16 i UTF-32

UTF-8

Obecnie dominujący kod w internecie. UTF-8 jest używany w 94% stron internetowych. Koduje najczęściej używane znaki, podstawowe liczby i język angielski za pomocą 8-bitów. UTF-8 używa minimum 1 bajta. UTF-8 jest również identyczny z ASCII dla języka angielskiego. Oznacza to, że każdy tekst w ASCII jest również tekstem w UTF-8.

Przykład kodu znaków UTF-8

Źródło obrazu

UTF-16

Unicode z 16 bitami. Chociaż początkowo używany był w systemach takich jak Windows i Java, nigdy naprawdę nie przyjął się w Linuxie i macOS. Dzisiaj UTF-16 jest używany w 0,01% stron internetowych. UTF-16 używa minimum 2 bajtów.

Przykład zestawu znaków Unicode UTF-16

Źródło obrazu

UTF-32

Unicode z 32 bitami. Zaletą UTF-32 jest to, że punkty Unicode są bezpośrednio indeksowane. Wadą jest to, że nie jest efektywny pod względem wykorzystania przestrzeni, ponieważ zawsze używa 4 bajtów. Oznacza to do dwukrotnie większy rozmiar niż UTF-16 i czterokrotnie większy niż UTF-8.

Podsumowując

Więc jakie są korzyści SEO związane z charset? Chociaż nie jest to bezpośredni czynnik rankingowy, musisz być świadomy swojego charset. Jeśli przypadkowo wyświetlisz 2 różne standardy w swoim meta charset lub nie będziesz przestrzegać zasad standardu poprawnie, wówczas pojawi się problem z dekodowaniem, a twoja treść nie będzie wyświetlana poprawnie. To negatywnie wpłynie na twoje SEO.

Jeśli poprawnie zaimplementujesz swój zestaw znaków, pomoże to zapobiec wysokiej wskaźnikowi odrzuceń, nie da ludziom powodu, by nie linkować do Ciebie, a wyszukiwarki nie będą mogły błędnie interpretować Twojej treści, co pomoże Twoim działaniom SEO.