Wegens verbouwing gesloten

(correcties en andere kleine aanpassingen 6 januari)

Mispoes

Deze site niet hoor, want ik doe dat nooit zo. Daar gaat het juist om.

Grappig

Best een grappig artikeltje, dit, bij De Speld. Smaakmakende citaatjes:

Dit artikel is momenteel niet leesbaar. Vanaf 6 januari is het weer mogelijk dit artikel te lezen.
[...]
De tekst en eventueel beeldmateriaal is uitsluitend bestemd voor de lezer. Mogelijk bevat dit artikel vertrouwelijke informatie die beschermd is door auteursrechten.

Zoals gebruikelijk is het niet alleen maar lol en satire bij De Speld, maar hekelen ze ook iets dat echt bestaat, waaraan we soms zo gewend zijn dat we vaak denken dat het maar gewoon is, terwijl het als je er beter over nadenkt best raar of zelfs onzinnig is. (Best veel overbodige bijwoorden in deze zin weer, maar ik vind het nou eenmaal gewoon lekkerder zo op deze manier. Sorry, excuus en het spijt me.)

Ik moest dan ook meteen denken aan e-maildisclaimers, waarvan ik altijd al vond dat ze irritant en dacht dat ze nutteloos waren, wat ik later deskundige Arnoud Engelfriet zag bevestigen. 9 oktober 2008, ruim vijf jaar terug al weer. Mijn gevoelen deed zich dus ruim daarvoor al voor.

Indrukgevend citaat:
De e-mail bevatte zes regels informatie en 25 regels disclaimer.
[...]
[...]
De informatiedichtheid van de overige mededelingen is ook vrijwel nul.

Tijdelijk offline voor back-up?

Dat over het aspect zinloze zicheronderuitproberentedraaienblabla. De andere kant is de tijdelijke onbeschikbaarheid van de content. Die deed me ook weer ergens aan denken, namelijk aan het handelsregister. Ik denk wat af, op een gemiddelde dag.

Leest u even mee?

08:00 - 18:00 uur: beschikbaar
18:00 - 24:00 uur: vrijwel altijd beschikbaar, soms vindt er onderhoud plaats
24:00 - 08:00 uur: niet beschikbaar wegens back-upprocedures

Eens even rekenen. Zo extreem groot kan zo’n handelsregister toch niet zijn, dat er elke nacht de hele nacht over geback-upt moet worden?

Overdreven gesteld heeft zowat iedereen tegenwoordig wel een bedrijf, om zzp’er te zijn of al was het maar vanwege vage half mislukte plannen dat ooit nog te worden. De paar mensen die geen bedrijf hebben, compenseren voor de honderden of duizenden grotere bedrijven, waarvoor meer gegevens zijn vastgelegd, doordat er meer tekenbevoegde functionarissen en concernrelaties zijn, en verplicht te deponeren jaarverslagen (zitten die in het handelsregister of ergens apart?)

Dan kom ik op een geschatte 30 regels à 60 tekens maal 16 miljoen. Dat is 28,8 gigabyte. Er zal nog wat bijkomen aan indexen om de boel doorzoekbaar te maken. Zeg totaal 32 gigabyte.

Dagelijks back-up ik zelf meerdere keren ruim 8 gigabyte aan BestCrypt-containers van mijn laptop naar externe schijven. Dat kost, zelfs met USB 2.0 (lang niet de snelste versie) maar enkele minuten, hooguit een kwartier. Het naar schatting ruim vier keer zo grote handelsregister van heel Nederland moet dus binnen een uur – niet een hele nacht – te back-uppen zijn – zelfs als steeds alles wordt meegenomen, en niet alleen de recente wijzigingen. Dat laatste zou bij een slimme opzet mogelijk zou moeten zijn.

Bovendien: dat een register tijdens het back-uppen niet openstaat voor wijzigen, dat kan ik begrijpen. Want anders kreeg je inconsistente back-ups. De database moet dan dus schrijfbeveiligd zijn. Maar ondertussen is tegen lezen van de dan tijdelijk statische data-inhoud geen bezwaar. Zelfs tijdens dat ene back-upuur ’s nachts kan de website gewoon open blijven en zouden bezoekers het handels­register moeten kunnen raadplegen.

Elke dag 8 uur de boel op slot voor back-up is onbegrijpelijk.

Tijdelijk offline voor onderhoud?

Over het handelsregister vermeldt de Kamer van Koophandel ook:

18:00 - 24:00 uur: vrijwel altijd beschikbaar, soms vindt er onderhoud plaats

Dat vind ik ook raar. Je leest dat wel vaker op het web, van die meldingen “Deze website is tijdelijk niet beschikbaar wegens onderhoud. Er wordt gewerkt aan een nieuwe versie, die zo snel mogelijk online komt.“

Ik doe zelf bijna voortdurend onderhoud aan mijn site, maar die hoeft daar nooit voor plat. Ik wijzig, vul aan en test op een kopie op een andere computer, helemaal los van de webserver. Als er iets klaar is, zet ik dat met FTP over naar de servercomputer (ook weer een gedeeltelijke kopie van de site, alleen recent gewijzigde bestanden) en kopieer het materiaal vandaar met ssh en rsync naar de plek waar webserver Apache de bestanden zoekt (de zogeheten DocumentRoot).

Daarmee is de wijziging doorgevoerd, met nul seconden downtime. In het ergste geval moet een bezoeker F5 doen of klopt er even een hyperlink niet, doordat een nieuwe pagina verwijst naar een oude die nog in de cache staat.

Ik werk vrijwel alleen met statische HTML-bestanden. Misschien is dat het. Een bewerkelijke methode, maar wel zeer snel, klein en flexibel.

Voor migratie dan?

Ik heb in de loop der jaren minstens vier keer mijn hele site gemigreerd van de ene naar een andere fysieke server (VPS, Virtual Private Server). Ook een keer een webwinkel die met PHP en MySQL werkte.

Ook dan kan, als alles goed gepland is en goed verloopt, de downtime beperkt blijven tot enkele minuten. De procedure is dan:

  1. Wijzigingen op de oude server tijdelijk blokkeren (tijdsbestek van uren tot dagen).
  2. Alles (HTML en eventuele PHP en database) overkopiëren naar de nieuwe server.
  3. DNS omschakelen naar nieuw IP-nummer.
  4. Op de nieuwe locatie mag gewijzigd worden, op de oude nog steeds niet.

Door de soms trage propagatie van DNS gaat de omschakeling niet voor alle bezoekers op hetzelfde moment. Maar passieve toegang, dus het raadplegen van gegevens, hoeft op deze manier, ondanks de rigoureuze verhuizing, in feite nooit onderbroken te worden. Hoogstens even voor een laatste test (nadat eerder alles al elders getest is) op de productieserver, zonder dat nog bezoekers worden toegelaten.

Dus “site gesloten wegens onderhoud” ervaar ik als onzin. Misschien zie ik het te simpel.

Zwaar belaste site?

Load balancing, zou dat het probleem zijn?

Ik heb wel eens met ab vastgesteld dat zelfs de kleinste VPS bij Tilaa makkelijk 400 HTML-aanvragen per seconde trekt.

Dit ondanks mijn inefficiënte getrapte CSS via CGI. En met als webserver Apache, die niet per se bekend staat als performancekampioen. (Hoewel, 2.4 wel? Ik meen dat ik de testen nog met 2.2 deed.)

In werkelijkheid heb ik gemiddeld, over het hele etmaal verdeeld, maar één HTML- of CGI-bezoekersaanvraag per twee minuten. Bij een verveertig­duizend­voudiging van de belangstelling zou de VPS het dus voor het eerst een beetje warm kunnen krijgen. En dan nog: vergroten en versterken kan bij Tilaa binnen enkele seconden of minuten, in ruil voor een wat hoger maandbedrag.

Zou zo’n handelsregister of soortgelijke publieksinformatiesite echt zo massaal worden geraadpleegd, dat zoals voor Google of Youtube vele fysieke servers met load balancing nodig zijn? Ik weet het niet. Het kan. Alles kan.