Gesorteerd op onderwerp

Kapotte links opsporen

Voor de meeste type websites in WebHare kun je een linkrapport uitdraaien: een lijst welke links op je website niet werken. De linkchecker werkt als een zoekmachine en daarom niet realtime. Ongeveer 48 uur na een aanpassing zou de linkchecker wijzigingen moeten vinden. In de Excel-download (zie hieronder voor uitleg) zie je ook een kolom staan die aangeeft wanneer een link voor het laatst gecontroleerd is.

Hiervoor heb je twee opties in de Publisher van WebHare:

  1. Per tekstpagina: Op de eigenschappen (properties) van je tekstbestand geeft het laatste tabje aan, welke links er binnen je pagina kapot zijn. Je kunt deze links op de pagina opzoeken en aanpassen.
  2. Compleet rapport voor gehele website: Selecteer in het linker scherm je website (wereldbol) en kies rechts boven in het Menu à Sites à Link check.

Het linkrapport voor de gehele website

Als je voor optie twee hebt gekozen toont WebHare een lijst van kapotte links:

De verschillende kolommen:

  • Kolom 1/file: geeft aan welk bestandje/pagina in je website een kapotte link heeft
  • Kolom 2/URL: geeft aan welke link dat is, die niet meer werkt
  • Kolom 3/Link tekst: geeft aan, achter welk woord op je pagina de kapotte link ‘verstopt’ zit, zodat je hem snel kan vinden als je de pagina opent
  • Kolom 4/Status: geeft bij muis over het symbool aan waarom het systeem denkt dat er iets niet werkt. Als een link kapot is dan geeft de status een ‘Page not found/404’ aan. Er zijn andere meldingen, zoals ‘Inloggen/401’ als een login verplicht is of ‘No access/403’ als het een intranet betreft waar WebHare je niet bij kan. Advies: verhelp de ‘Page not found/404’-meldingen, en kijk even over de andere meldingen heen of je iets geks ziet staan in de link. De andere hoef je meestal niet op te pakken.

Je hebt twee opties: of direct vanuit dit scherm werken of een Excel-bestand downloaden,

Optie 1: Werken met het scherm van de link checker

Indien de lijst niet extreem lang is kun je meestal het beste direct vanuit dit scherm te werken. Dubbelklik een regel in het scherm om naar de betreffende map in WebHare te gaan. Daar kun je dan het bestand openen (WebHare teksteditor) of downloaden (Word of ander bestand) om de link in het bestand aan te passen.

Optie 2: Lijst als Excel-bestand downloaden

Daarnaast kun je de lijst ook als Excelbestand (of .csv) exporteren. Gebruik daarvoor de knop links boven op het scherm (CSV Export) en kies of Excel of .csv in het vervolgscherm.

Het Excelbestand bevat wat meer kolommen, zoals:

  • Op welke dag de betreffende pagina gecontroleer is (datum van de afgelopen drie dagen)
  • Welke datum het bestand geplaatst/gewijzigd is
  • Etc

Voor een goed overzicht raden we het volgende aan:

  1. Verwijder een aantal kolommen, zodat je alleen nog deze kolommen over houdt:
    1. URL (de link die niet meer werkt)
    2. File URL (het bestand in webhare dat de kapotte link bevat
    3. Status code
  2. Sorteer de kolom ‘status code’ van A tot zet door deze kolom te selecteren (grijze balk boven de kolom aanklikken), vervolgens in Excel op A-Z sorteren te klikken (zie screenshot hieronder) en dan van A-Z laag naar hoog te kiezen. In het vervolgscherm OK klikken, en de kolom is gesorteert op alfabet.
  3. Je hoeft alleen de 404-regels te houden. De andere regels kun je verwijderen (eventueel even overheen kijken of je iets geks ziet, wat mogelijk de fout veroorzaakt).
  4. Nu je alleen nog de 404-meldingen over hebt waar je mee aan de slag moet kun je het beste sorteren op File URL. Selecteer de kolom File URL (op grijze kolom bovenaan klikken) en sorteer weer op A tot Z. Daarmee zorg je ervoor dat alle kapotte links op een bepaalde pagina direct onder elkaar genoemd staan, zodat je niet meerdere keren hetzelfde bestand moet opzoeken, maar alle kapotte links op de pagina direct bij elkaar krijgt.
  5. Loop de lijst File URL van boven naar onder door en kijk wat er kapot is.
    1. Zoek het bestand op in de Publisher van WebHare: Klapt stuk voor stuk de mappen open om het bestand op te zoeken.
      Tip: Selecteer en kopieer (CTRL C) de eerste URL, ga naar de Publisher in WebHare en zoek het bestand op met CTRL SHIFT G (functie zit ook boven rechts in het menu onder Go To/Site or URL. [CTRL SHIFT G werkt alleen maar als je de publisher net geopend hebt of als je een willekeurig bestand in de publisher hebt aangeklikt.]
    2. Open (WebHare tekst editor) of download het bestand (Word of andere besatnden van je computer) om het linkje (zoals genoemd in de eerste kolom in het Excel-sheet) op te zoeken en aan te passen.

Bijlage voor gevorderden & Geinteresseerden: De exacte Codes in de linkchecker

In de kolom ‘Status’ in het Excel-bestand wordt een code getoond. Als deze code maar uit één cijfer bestaat (bijv: 0; 3; 7) dan kun je deze foutmelding negeren. De codes 100 en hoger zijn de standaard HTTP statuscodes. Als bij het checken van een link geen HTTP-verbinding kon worden opgezet, is er ook geen HTTP-statuscode. Ook voor een aantal andere foutsituaties (bijvoorbeeld een pagina die naar zichzelf verwijst) kan het zijn dat er geen HTTP-statuscode is. De volgende extra codes worden gebruikt:

#

Betekenis

Uitleg

001

Socket error

Error creating TCP socket

002

Server not found

The server name could not be resolved

003

Could not connect

No connection to the server could be made

004

Connection timed out

Making a connection to the server timed out

005

No HTTP connection

Could not open HTTP connection

006

No secure connection

Connection could not be secured (SSL connection)

007

Request could not be sent

The HTTP request could not be sent to the server

008

No HTTP response

No valid HTTP response received from the server

009

Circular redirection

Got a circular redirection

010

Too many redirections

Redirection chain is too long

 Belangrijke HTTP-statuscodes zijn:

#

Betekenis

Uitleg

400

Foute aanvraag

Bekijk handmatig of deze link nog klopt.

403

Geen toegang

Dit is vaak het intranet; de linkchecker heeft dan gewoon geen toegang. Je kan zelf even kijken of de link nog werkt.

404

Pagina niet gevonden

Deze link is kapot en moet vervangen worden. >>> BELANGRIJKSTE ERROR VOOR GEBRUIKERS.

405

Methode niet toegestaan

Bekijk handmatig of deze link nog werkt.

500

Serverfout

Hier kan weinig aan gedaan worden. Het probleem ligt bij de website waar naartoe gelinkt wordt.