Podziel się nim z innymi!
Często spotykamy się z wynikami wyszukiwań, w których to widnieje link bezpośredni do dokumentu PDF.
Z informacji, które Google umieściło na swoim Blogu kilka dni temu wynika, że proces indeksacji dokumentów PDF rozpoczął się od 2001 roku i w swojej bazie ma zaindeksowanych setki milionów dokumentów typu PDF, czyli krótko mówiąc, indeksuje w pełni dokumenty PDF.
Co ciekawe, w większości przypadków pliki PDF osiągają zbliżone pozycje do witryn o podobnej tematyce w wynikach wyszukiwania, jednak należy pamiętać o optymalizacji takiego dokumentu, gdyż same dokumenty posiadają zwykle bardziej rozbudowaną strukturę tekstową niżeli same witryny HTML, a jak wiadomo, Google w głównej mierze indeksuje treść pisaną.
Przykładowe wyniki wyszukiwania dokumentu PDF w wyszukiwarce Google.pl
Odnośnie dokumentów PDF i ich indeksacji nasuwają się pytania:
Czy Google indeksuje każdy rodzaj plików PDF?
Otóż sama wyszukiwarka może indeksować treść takiego dokumentu, które jak wiadomo używają różnych rodzajów kodowań znaków jednak pod warunkiem, że takie dokumenty nie są zablokowane hasłem bądź szyfrowane w inny sposób.
Ogólnie, jeśli sami użytkownicy przeglądając dokument, są w stanie skopiować treść z dokumentu PDF to i samej wyszukiwarce Google nie powinno to sprawić żadnego problemu i takie treści powinna zaindeksować.
W pewnym stopniu dokumenty PDF możemy poddać procesowi optymalizacji tak, aby były jak najbardziej wartościowe w dziedzinie pozycjonowania.
Jak można optymalizować dokument PDF?
W zależności w jakim edytorze tworzymy dokument np. MS Word, Open Office .org, w właściwościach dokumentu można umieścić informacje optymalizacyjne, które jak w przypadku HTML gdzie uzupełniamy meta informacje typu Title, Description, Keywords, można je umieścić w właściwościach dokumentu w polach takich jak Autor, Tytuł, słowa kluczowe i opis dokumentu.
Przykład ustawień dokumentu w przypadku OpenOffice.org:
Warto również zwrócić uwagę, aby dokument w głównej mierze stworzony był z tekstów, a nie obrazków, bądź co gorsza z tekstów umieszczonych na obrazkach. Jak pisałem na początku artykułu, Google indeksuje tekst, także na to trzeba zwrócić szczególną uwagę.
A co zrobić z linkami, jeśli chce je umieścić w dokumencie PDF?
W przypadku linków zawartych w dokumentach PDF, również są one indeksowane przez wyszukiwarkę i pracują na podobnej zasadzie jak linki, prowadzące ze stron typu HTML (przenoszą również PageRank, więcej informacji w dalszej części artykułu).
Można np. w linkach prowadzących do stron zawartych w dokumencie PDF wpisywać tak samo słowo kluczowe jak np. w przypadku umieszczania artykułów w precelkach.
W przypadku jeśli chcemy, aby w wynikach wyszukiwania wyświetlała się nazwa dokumentu taka, jaka nam będzie odpowiadała, należy wypełnić taką samą treścią element w PDF w tytule z metadanymi (właściwości dokumentu w edytorze tekstu) pliku oraz w Anchor tekstach prowadzących do dokumentów PDF z Twojej witryny internetowej.
A co z obrazkami w dokumencie PDF? Czy Google je indeksuje?
Co tyczy się natomiast obrazków, jeśli są zawarte w pliku PDF to nie są one same w sobie indeksowane, jednak można optymalizować ALT obrazków (alternatywne treści obrazków) tak samo jak w przypadku HTML'a.
Jak zatem tworzyć sam tekst, czy można go optymalizować tak samo jak treść w HTMLu?
Oczywiście, należy zwracać uwagę na nagłówki, w których w głównej mierze należy umieszczać słowa kluczowe najważniejsze dla nas, a i w samym tekście dokumentu warto główne słowa kluczowe pogrubiać, gdyż Google tak jak w przypadku HTML tak i w PDF zwraca większą uwagę na treść pogrubioną i treści zawarte w nagłówkach.
W skrócie, na co należy zwrócić uwagę przy optymalizacji dokumentu PDF?
Co, jeśli nie chcemy, aby wyszukiwarka Google indeksowała moje PDFy?
W przypadku, jeśli nie chcemy, aby wyszukiwarka Google zaindeksowała pliki typu PDF, wystarczy, aby w nagłówku pliku HTML takiego pliku dodać informację X-Robots-Tag z wartością noindex. W przypadku, jeśli Google już zdążyło zaindeksować dokumenty PDF, można zastosować tą samą technikę. Z czasem Google wyrzuci zaindeksowane dokumenty PDF z wyników wyszukiwania.
A co z duplikowaniem treści w przypadku PDFów?
Nieraz można się spotkać z treściami PDF, które w identycznej formie, bądź zbliżonej, istnieją również w formacie HTML. Samo Google zaleca, aby nie tworzyć duplikatów treści, tylko pozostawić jedną z form jej wyświetlania (czy to w formacie HTML, czy też PDF).
W przypadku, jeśli nie da się w żadnym wypadku wykluczyć formatu HTML i PDF z tą samą treścią, bądź bardzo zbliżoną, zalecane jest wskazać preferowany URL przez wpis w sitemapie, a sitemapę umieścić w koncie WebMaster Tools.
Czy można wykonać przekierowanie 301 z PDF'a?
W przypadku, jeśli mamy zaindeksowany w wynikach wyszukiwania dokument, który z przyczyn niezależnych od nas musimy wstawić w innym miejscu, aby uniknąć duplikowania się treści, można zastosować przekierowanie 301 z takiego dokumentu do nowego adresu (na podobnej zasadzie jak w przypadku 301 do innych podstron w HTML). Wystarczy mieć tylko dostęp do pliku .htaccess i odpowiednio go skonfigurować, tak aby po wejściu na link prowadzący do PDF'a, automatycznie przekierowało nas na inny adres z tym dokumentem lub z jego aktualną wersją.
Czy kompresja dokumentu wpływa na jego indeksację?
Odpowiedź nie jest jednoznaczna, jednak należy z kompresją zachować umiar i w przypadku prostych dokumentów (kilku stronicowych), zawierających tylko kilka zdjęć i niewiele tekstu, nie musimy stosować dużej kompresji (można ją nawet pominąć), jednak w przypadku większych dokumentów, warto eksperymentować z kompresją, tak by zachować kompromis między wielkością a jakością treści w PDF. W przypadku, jeśli Twój dokument przekracza wszelkie granice i jest bardzo duży, warto zastanowić się nad podziałem go na kilka mniejszych dokumentów odpowiednio je potem optymalizując.
Czy dokument PDF dostępny na stronie może przenosić PageRank?
Z doświadczenia mogę napisać, że jeśli sam dokument PDF posiada Page Rank (można to sprawdzić np. za pomocą dodatku do przeglądarke internetowych SeoQuake, więcej o sprawdzaniu Page Rank możesz przeczytać w artykule Co to jest Google Page Rank i jak go sprawdzić), linkowanie z dokumentów PDF do innych stron pozwala na przekazanie PageRanku stronie linkowanej z dokumentu.
Podsumowanie
Same dokumenty PDF są w pełni indeksowane przez wyszukiwarki internetowe oraz treści zawarte w dokumencie PDF w każdym języku (o ile są możliwe do skopiowania), nie stanowią żadnego problemu dla samej wyszukiwarki Google. Warto wspomóc ten proces odpowiednio optymalizując dokument PDF pod pozycjonowanie.
Również arkusze kalkulacyjne, jak i prezentacje są indeksowane przez wyszukiwarkę internetową Google, jednak to już pozostawiam na inny artykuł.
Pomoce wykorzystane w tworzeniu artykuły:
GoogleWebMasterCentral.BlogSpot.com
SeoMoz.org
Seoconsultants.com
Korzystanie z serwisu oznacza akceptację polityki prywatności.copyright: KsiegaPozycjonera.pl. Wszelkie prawa zastrzeżone.