PDA

View Full Version : Se poate o lamurire despre eroarea 404 ?


Seinfeld
08-18-2008, 10:15 PM
Citeam pe blogul celor de la google (http://googlewebmastercentral.blogspot.com/2008/08/farewell-to-soft-404s.html) despre eroarea 404 si nu sunt prea lamurit. Din cate am inteles eu ar trebui eliminate paginile astea care "nu exita". Spre exemplu wordpress genereaza o multime de astfel de pagini.
Am inteles bine sau imi scapa mie ceva?

alecs
08-19-2008, 10:48 PM
In primul rand aici (http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html)sunt explicate pe rand fiecare dintre codurile posibile.

Nu am inteles exact ce ai vrut sa spui, dar nu poti elimina paginile 404. Fiecare pagina returnata browserului are un cod (200 - OK, 301 - permanent redirect, 404 - not found, etc.)
Cand vizitatorul ajunge pe o pagina care nu exista pe server, acesta ii raspunde trimitand inapoi o pagina de eroare, cu codul 404. Daca doresti sa nu pierzi vizitatorul, poti modifica aspectul acesteia incat sa semene ca o alta pagina de pe site (sa includa meniu si alte linkuri inapoi catre site). Totodata pe acea pagina va aparea scris un mesaj corespunzator ("eroare, pagina cautata nu exista", etc.). Un utilizator obisnuit va intelege mesajul.
Problema apare cand afisezi o asemenea pagina si trimiti codul 200. Pentru crawleri, asta inseamna ca acea pagina e bine mersi.

Seinfeld
08-19-2008, 11:00 PM
Da, e adevarat, nu m-am exprimat prea bine.

Spre exemplu la wordpress, daca incerci sa cauti ceva care nu exista prin blog,va aparea pagina aia "not found" care insa returneaza statusul 200.

Cum pot sa il schimb in 404?

alecs
08-20-2008, 01:35 AM
OK, dar pagina in care iti arata rezultatele (care nu sunt) tot... exista :)
Deci abordarea corecta este sa lasi codul pe 200, dar sa o scoti din calea spiderilor (robots.txt, meta, etc.). Asa face si google.

O mica paranteza doar pentru a ma asigura ca vorbesti despre searchul din wordpress care, in functie de cuvinte, iti va returna sau nu rezultate:
http://www.blog.com/?s=cuvant1+cuvant2+cuvant3

Krumel
08-20-2008, 11:44 AM
Eu am patit o faza destul de ciudata cu un client.
Au modificat paginile 404 din htaccess iar ca rezultat a generat pagini indexistente. Normal ele au fost indexate de Google.
Acum incearca sa le refaca punand un redirect 301.

N-am idee ce o sa iasa....

Seinfeld
08-20-2008, 04:25 PM
Bine, si mai concret, dau un exemplu cu blogul meu:
- pentru o pagina care nu exista http://www.zambesc.com/nuexista/ imi returneaza o pagina functionabila ce returneaza codul 404
- la o cautare care nu exista: http://www.zambesc.com/?s=nuexista imi returneaza aceasi pagina, insa codul este 200
Se poate ca si pentru aceasta a doua varianta sa modific ceva pe undeva atfel incat sa returneze codul 404 , sa se comporte ca in prima varianta ?