Re-indexing (herindexering)

by ADMIN 28 views

Re-indexing (herindexering): Een Onderzoek naar de Effecten op de Zoekindex

In de afgelopen maanden heeft @robvandijk een groot aantal bugs gefixt, wat resulteert in meer gegevens die worden geïmporteerd. Dit heeft echter niet direct invloed op items uit het verleden, aangezien alleen recente items elke nacht worden geïmporteerd. Hierom is het soms nodig om alles opnieuw te indexeren: de grote importen uit alle bronnen opnieuw uitvoeren en de zoekindex bijwerken.

De Oorsprong van het Probleem

Rob heeft een uitleg gegeven over de oorsprong van het probleem:

De eerste kolom achter de naam is de grootte van de index na herindexering (in MB), de tweede kolom is de grootte van de index in de huidige ORI. Omdat we tijdens de herindexering ook markdown opslaan verwacht je dat alle indexes ongeveer 1/3 groter worden. Laatste kolom is de grootte van de nieuwe index gedeeld door de grootte van de oude index. Als daar een sterretje achter staat is de nieuwe index kleiner dan de oude, die moeten tzt nog een keer uitgezocht worden, net als degenen met 0 documenten. Heiloo wordt op dit moment verwerkt en nieuwe index zal dus nog groeien.

De Gegevens

Hieronder volgen de gegevens die Rob heeft verstrekt:

Index Nieuwe Grootte Oude Grootte Verhouding
ori_amsterdam 46512 16700 2,79
ori_haarlem 14425 7923 1,82
ori_den_haag 11942 186 64,20
ori_den_bosch 9305 4867 1,91
ori_katwijk 9137 3359 2,72
ori_groningen 8754 4619 1,90
ori_arnhem 8292 3623 2,29
ori_haarlemmermeer 7912 2599 3,04
ori_nissewaard 7889 2769 2,85
osi_provincie-utrecht 6912 4356 1,59
ori_almelo 6786 2395 2,83
ori_maastricht 6731 875 7,69
ori_apeldoorn 6644 1953 3,40
ori_amstelveen 6288 2934 2,14
ori_enschede 6212 2201 2,82
ori_aalsmeer 5519 1081 5,11
ori_barneveld 5453 2905 1,88
ori_schiedam 5278 1722 3,07
ori_middelburg 5200 3388 1,53
osi_groningen 4766 2825 1,69
ori_leiden 4534 2144 2,11
ori_dordrecht 4507 223 20,21
ori_duiven 4489 2033 2,21
ori_haaksbergen 4412 2423 1,82
ori_goirle 4251 2680 1,59
ori_eindhoven 4078 1627 2,51
ori_bernheze 4055 2136 1,90
ori_baarn 3910 1685 2,32
ori_maassluis 3823 1842 2,08
ori_ridderkerk 3679 2302 1,60
ori_almere 3651 2008 1,82
ori_emmen 3623 1371 2,64
ori_albrandswaard 3614 2119 1,71
ori_brunssum 3573 1438 2,48
ori_purmerend 3569 1533 2,33
ori_delft 3560 1128 3,16
ori_bergen_nh 3550 1929 1,84
ori_ede 3503 499 7,02
ori_venlo 3472 3161 1,10
ori_amsterdam_zuid 3449 2137 1,61
ori_rhenen 3444 714 4,82
ori_boxtel 3421 946 3,62
ori_barendrecht 3375 1731 1,95
ori_capelle_ad_ijssel 3371 1669 2,02
ori_gilze_en_rijen 3371 1593 2,12
ori_hendrik-ido-ambacht 3370 919 3,67
ori_beuningen 3329 47 70,83
ori_oost_gelre 3262 1623 2,01
ori_rucphen 3260 1502 2,17
ori_eemnes 3195 55 58,09
ori_bodegravenreeuwijk 3181 909 3,50
ori_stichtse_vecht 3106 2819 1,10
ori_doetinchem 3088 1752 1,76
ori_ijsselstein 3070 1411 2,18
ori_etten-leur 3046 1413 2,16
ori_heerlen 2917 1120 2,60
ori_dinkelland 2889 1825 1,58
ori_roosendaal 2865 1578 1,82
ori_noordoostpolder 2858 1713 1,67
ori_cuijk 2857 573 4,99
ori_steenbergen 2851 2270 1,26
ori_oisterwijk 2817 1424 1,98
ori_halderberge 2805 1060 2,65
ori_neder-betuwe 2744 912 3,01
ori_elburg 2716 1012 2,68
ori_amsterdam_centrum 2692 1178 2,29
ori_horst_aan_de_maas 2651 971 2,73
ori_amsterdam_noord 2634 1036 2,54
ori_altena 2623 1105 2,37
ori_geertruidenberg 2611 2114 1,24
ori_aalten 2600 1245 2,09
ori_harderwijk 2588 902 2,87
ori_baarle_nassau 2582 1043 2,48
ori_putten 2549 1548 1,65
ori_den_helder 2529 1733 1,46
ori_hillegom 2506 1291 1,94
ori_goes 2490 1046 2,38
ori_tubbergen 2469 1838 1,34
ori_de_ronde_venen 2428 496 4,90
ori_krimpen_ad_ijssel 2420 1073 2,26
ori_pijnacker_nootdorp 2381 1065 2,24
ori_hulst 2364 752 3,14
ori_nunspeet 2364 826 2,86
ori_schagen 2359 1027 2,30
ori_edam-volendam 2341 836 2,

Re-indexing (herindexering): Een Q&A Artikel

In dit artikel zullen we antwoorden geven op veelgestelde vragen over re-indexing (herindexering) en de effecten ervan op de zoekindex.

Q: Wat is re-indexing (herindexering)?

A: Re-indexing (herindexering) is het proces waarbij de zoekindex wordt bijgewerkt en opnieuw geïndexeerd wordt. Dit wordt nodig als er nieuwe gegevens zijn toegevoegd of als de zoekindex niet meer up-to-date is.

Q: Waarom is re-indexing (herindexering) nodig?

A: Re-indexing (herindexering) is nodig om ervoor te zorgen dat de zoekindex up-to-date is en dat gebruikers de juiste informatie kunnen vinden. Als de zoekindex niet meer up-to-date is, kan het zoeken naar informatie moeilijk of onmogelijk worden.

Q: Hoe werkt re-indexing (herindexering)?

A: Re-indexing (herindexering) werkt als volgt:

  1. De zoekindex wordt geleegd en opnieuw geïndexeerd.
  2. Alle nieuwe gegevens worden toegevoegd aan de zoekindex.
  3. De zoekindex wordt bijgewerkt en opnieuw geïndexeerd.

Q: Wat zijn de voordelen van re-indexing (herindexering)?

A: De voordelen van re-indexing (herindexering) zijn:

  • De zoekindex is up-to-date en werkt correct.
  • Gebruikers kunnen de juiste informatie vinden.
  • De zoekindex is sneller en efficiënter.

Q: Wat zijn de nadelen van re-indexing (herindexering)?

A: De nadelen van re-indexing (herindexering) zijn:

  • De zoekindex wordt geleegd en opnieuw geïndexeerd, wat tijd en resources kan kosten.
  • Gebruikers kunnen tijdelijk geen toegang hebben tot de zoekindex.

Q: Hoe vaak moet re-indexing (herindexering) worden uitgevoerd?

A: De frequentie van re-indexing (herindexering) hangt af van de hoeveelheid nieuwe gegevens en de complexiteit van de zoekindex. In het algemeen wordt re-indexing (herindexering) uitgevoerd wanneer:

  • Er nieuwe gegevens zijn toegevoegd.
  • De zoekindex niet meer up-to-date is.
  • De zoekindex wordt bijgewerkt en opnieuw geïndexeerd.

Q: Kan re-indexing (herindexering) worden uitgevoerd door een mens?

A: Nee, re-indexing (herindexering) kan niet worden uitgevoerd door een mens. Het is een automatisch proces dat door software wordt uitgevoerd.

Q: Kan re-indexing (herindexering) worden uitgevoerd door een robot?

A: Ja, re-indexing (herindexering) kan worden uitgevoerd door een robot. Robots kunnen automatisch de zoekindex bijwerken en opnieuw indexeren.

Q: Wat zijn de risico's van re-indexing (herindexering)?

A: De risico's van re-indexing (herindex) zijn:

  • De zoekindex wordt geleegd en opnieuw geïndexeerd, wat tijd en resources kan kosten.
  • Gebruikers kunnen tijdelijk geen toegang hebben tot de zoekindex.
  • Er kan fouten optreden tijdens het proces van re-indexing (herindexering).

Q: Hoe kan ik re-indexing (herindexering) optimaliseren?

A: Re-indexing (herindexering) kan worden geoptimaliseerd door:

  • De zoekindex regelmatig te bijwerken en opnieuw te indexeren.
  • De hoeveelheid nieuwe gegevens te beperken.
  • De complexiteit van de zoekindex te verminderen.

Q: Kan ik re-indexing (herindexering) uitstellen?

A: Ja, re-indexing (herindexering) kan worden uitgesteld als:

  • Er geen nieuwe gegevens zijn toegevoegd.
  • De zoekindex nog up-to-date is.
  • Er geen urgentie is om de zoekindex bij te werken en opnieuw te indexeren.