Visies van Genkgo

 • De bouw van Genkgo Cloud

  Frederik Bosch
  08 juni 2015

  De afgelopen maanden is bij Genkgo zeer hard gewerkt aan de bouw van een eigen cloud platform. Als de bouw van het platform volledig is afgerond en bugs zijn verholpen, zal het onze klanten veel gaan bieden. Dit heeft aardig wat voeten in de aarde gehad. Met dit blog willen wij openheid van zaken geven en duidelijk maken dat Genkgo er alles aan doet om een zo stabiele mogelijke dienst te leveren.

  In dit artikel lichten we de totstandkoming van het platform toe. Allereerst wordt ingegaan op besluitvorming, daarna de realisatie en tot slot gaan we in op de toekomst. We zullen hierbij een aantal zaken bespreken waar we tevreden over zijn maar ook op zaken in gaan die niet goed gingen.

  foto van een wolk

  Besluitvorming

  In 2014 namen we het besluit om de inrichting van hosting te veranderen. Reden hier voor was een wens om onafhankelijker te zijn van leveranciers, zoals onze voormalige hostingleverancier Greenhost. In het verleden is gekozen voor die afhankelijkheid omdat Genkgo  zich alleen wilde concentreren op software- en webontwikkeling. Door de toenemende groei van het aantal klanten van Genkgo in de afgelopen jaren, kwam deze constructie onder druk te staan. De afhankelijkheid was te groot en de belasting die we daarmee op onze leverancier zette, zorgde voor onprettige situaties. Bovendien wilde Genkgo haar cloud geheel naar eigen wens inrichten, met meer dan voldoende kennis in huis om hostingzaken zelf te regelen. Er was grote behoefte aan een cloud die optimaal geschikt is voor onze software, en onze software alleen.

  Inrichting

  Nadat de keuze was genomen een eigen cloud op te gaan bouwen, hebben we ons een tweetal vragen gesteld. Welke eisen stellen we aan onze cloud? Welke werkzaamheden en verantwoordelijkheid gaan we naar ons toe trekken? Voor de antwoorden zijn wij terug gegaan naar de kernwaarden van het bedrijf Genkgo. Het platform dient voorop te lopen in innovatie. We willen onze klanten kunnen bedienen met de top-of-the-bill technologie. Daarnaast maakt Genkgo sinds oprichting deel uit van een duurzame, groene en energiebesparende waardeketen. Het is een vereiste dit te continueren. Tot slot dient het platform de privacy van onze klanten te waarborgen. Het moet duidelijk zijn waar de data van onze klanten staat en wie daar toegang toe heeft. Daarnaast willen we in staat zijn snel te reageren op veiligheidsproblemen zoals we dat bijvoorbeeld in 2014 deden voor het Heartbleed probleem.

  Onderzoek in de hostingmarkt leerde ons dat servers huren bij een hosting partij en daar zelf de software op te beheren en onderhouden de beste keuze was. Hostingpartij Vboxx uit Den Haag was bereid om speciaal voor Genkgo super snelle servers te plaatsen in Evoswitch te Haarlem, het duurzaamste datacentrum van Europa. Hierop worden automatisch driemaal dagelijks backups gemaakt zonder dat klanten daar hinder van ondervinden. Er wordt gebruik gemaakt van geavanceerde virtualisatie technologie die door Microsoft is ontwikkeld, genaamd Hyper-V. Dit een zeer goed gewaardeerd product.

  Infoworld score kaart van HyperV

  Realisatie

  De bouw van de cloud bestond uit een aantal fases. Allereerst moesten we onze eigen Genkgo software klaar maken om te kunnen werken op het nieuwe platform. Dit hebben we gedaan door versie 2.7 uit te brengen van onze software. Dit was vrij snel in orde gemaakt en leverde geen problemen op. Daarna hebben we de data overplaatst naar onze nieuw geprepareerde servers. Dit was een vrij groot werk dat we speciaal in de weekenden hebben gedaan om mogelijke overlast gedurende werktijd te voorkomen. Goed voorbereid zijn we hier aan begonnen. Met behulp van speciaal voor de verplaatsing ontwikkelde software werd het aantal menselijk handelingen en daarmee de kans op fouten gereduceerd. Daarnaast is de computer sneller dan de mens en kon downtijd van klanten bij het overplaatsen van de data extreem worden verkleind. De uiteindelijk downtijd bij overplaatsing bedroeg tussen 0 en 60 seconden per klant. De impact voor onze klanten is hier dus zeer klein geweest. Een aantal klanten heeft laten weten dat een flinke snelheidswinst op hun website te hebben gemerkt en daar blij mee te zijn.

  Onderhoud

  Met de succesvolle verplaatsing naar de nieuwe servers leek het moeilijkste gedeelte van de klus geklaard. Helaas was dit niet het geval. In het weekend van 19 april gingen onze servers opeens uit de lucht. Er was geen enkele indicatie dat de servers problemen hadden. Onderzoek wees uit dat de downtijd samen viel met het moment dat de servers bezig waren met backups. De volgende dag is in overleg met onze hostingpartij besloten te kiezen voor een andere backup-strategie die wordt aangeboden binnen HyperV. Daarna verdwenen de problemen en leek alles weer als normaal te werken. Maar dit was tijdelijk. Opnieuw ging het mis. Opnieuw was het gerelateerd aan backups. Na nieuw onderzoek, ook binnen onze eigen software, is de backup-strategie nogmaals aangepast. Helaas tevergeefs. Ook Microsoft-gecertificeerde medewerkers van Vboxx konden niet achterhalen wat hier nu aan de hand was.

  Daarmee stonden we voor een raadsel en waren in een moeilijke positie. Voor klanten van Genkgo die zeer intensief onze software gebruiken, ging dit alles niet onopgemerkt. Zij lieten volkomen terecht weten niet blij te zijn met de downtijd. Dus enerzijds hadden we hinder bij onze klanten en anderzijds nog geen oplossing voor het probleem. Uiteindelijk is besloten om de automatische backup strategie van HyperV tijdelijk uit te schakelen. Onze eigen database backup strategie bleef wel gewoon draaien, maar die backupt alleen databases en geen bestanden zoals foto's of andere documenten. Eens per week hebben we in de avonduren handmatig een HyperV backup gedaan en erop toegezien dat de backup slaagde. Hiermee waren we verzekerd van de beschikbaarheid van onze servers.

  Uit ons eigen onderzoek bleek dat het probleem zich alleen manifesteerde op zogenaamde Ubuntu (dit is een operating system zoals Windows en OSX, maar dan een Linux variant) machines. Daarop besloten we contact op te nemen met het 'kernel team' van Ubuntu. Dit team bestaat uit mensen die betrokken zijn bij het maken van dit operating system. Tevens is er contact gelegd met Microsoft via hun eigen HyperV development forum. Van het Ubuntu kernel team kregen we alle medewerking. Het is onvoorstelbaar hoe behulpzaam zij zijn geweest. Hun advies stelde ons in staat om nog meer informatie uit onze servers halen en zo dichter tot de kern van het probleem te komen. De nieuwe gegevens hebben we gebruikt om ons bericht op het Microsoft forum te verduidelijken.

  Foto van binnenzijde datacentrum

  Bugs in Microsoft HyperV

  Uiteindelijk kregen we van Microsoft een bevrijdende reactie. Er zitten bugs in de HyperV software voor Ubuntu en die manifesteren zich bij het maken van backups. Ook andere cloud-leveranciers blijken last te hebben gehad van de verschijnselen en downtijd. Microsoft heeft laten weten dat men al bezig was met 'patches' om het probleem op te lossen. Met behulp van het Ubuntu kernel team en Microsoft engineers zijn we momenteel bezig deze patches te testen en wanneer ze goed worden bevonden in productie te nemen.

  Hiermee hebben we eindelijk het lek boven. Toch heeft dit aardig wat voeten in de aarde gehad. Het  heeft enorm veel energie van het bedrijf gevergd en bovendien druk gezet op een aantal klantrelaties. Wij steken onze energie liever in projecten waar klanten profijt van hebben. Achteraf gezien zijn we van mening dat ons niet veel te verwijten valt. Het probleem is voor ons altijd prioriteit nummer één geweest en we hebben er alles aan gedaan om het op te lossen.

  Ook al lag het uiteindelijk buiten onze macht. Dit neemt uiteraard niet weg dat het heel vervelend is dat klanten last hebben gehad van deze problematiek. Met dit blog willen wij openheid van zaken geven en duidelijk maken dat Genkgo er alles aan doet om een zo stabiele mogelijke dienst te leveren. Daarvoor zijn we bereid heel diep te gaan.

  Toekomst

  Als de bouw van het cloud platform volledig is afgerond en de backup bugs zijn verholpen, zal het  onze klanten veel gaan bieden. Zo kunnen we nu al betere software ontwikkelen dankzij de additionele inzichten die we vanuit ons platform krijgen. Tevens zijn we in staat sneller updates op software (continuous deployment) uit te rollen. Wanneer kunnen we deze updates verwachten? Genkgo is bezig aan een grootse toevoeging voor de mobiele applicatie (VerenigingenApp), een nieuw evenementenbeheer applicatie en een vernieuwing van de webshop. Al deze updates zijn in een ver gevorderd stadium en zullen aanstaande zomer één voor één worden uitgerold. Via deze weg stellen we daar onze klanten van de op hoogte.