From 79a9ec0d3ce35f27c379c1eb3e67a39af951bd18 Mon Sep 17 00:00:00 2001 From: PanderMusubi Date: Tue, 29 Dec 2020 14:53:32 +0100 Subject: [PATCH] housekeeping and testing --- README.md | 7 +++++-- scripts/test.sh | 27 +++++++++++++++++++-------- 2 files changed, 24 insertions(+), 10 deletions(-) diff --git a/README.md b/README.md index b64c37f..4286457 100644 --- a/README.md +++ b/README.md @@ -29,6 +29,7 @@ De spellingcontrole bestaat, naast de documentatie en licentie, uit de volgende bestanden: - `nl.aff` - `nl.dic` +- `datetimeversion.txt` Deze zijn samengesteld en gecontroleerd met een aantal hulpbestanden: - `../opentaal-wordlist/wordparts.tsv` @@ -42,7 +43,6 @@ Deze zijn samengesteld en gecontroleerd met een aantal hulpbestanden: - `elements/outdated.tsv` - `elements/replacements.tsv` - `elements/stress.tsv` -- `datetimeversion.txt` De spellingcontrole bestaat uit de twee [UTF-8 Unicode](https://nl.wikipedia.org/wiki/UTF-8) bestanden @@ -53,7 +53,10 @@ mogelijk om van de meer dan 400.000 woorden uit de woordenlijst een woordenboek te maken dat minder dan de helft zo groot is én informatie heeft over vervoegingen, samenstellingen en suggesties. -Beschrijving van overige bestanden is: +De datum, de tijd en het versienummer van al deze bestanden is te vinden in +[datetimeversion.txt](datetimeversion.txt). + +Beschrijving van de overige bestanden is: - [elements/archaic.tsv](elements/archaic.tsv) (archaïsch), deze woorden zijn die nog wel gebruikt worden, alle zitten in de woordenlijst - [elements/excluded.tsv](elements/excluded.tsv), deze woorden moeten worden diff --git a/scripts/test.sh b/scripts/test.sh index 317e3c1..9334201 100755 --- a/scripts/test.sh +++ b/scripts/test.sh @@ -1,15 +1,26 @@ +if [ -z $(which hunspell) ]; then + echo 'Please, install Hunspell with sudo apt-get install hunspell' + exit 1 +fi + hunspell -d ../nl -G -1 ../elements/obsolete.tsv > obsolete-hunspell-failed.txt hunspell -d ../nl -G -1 ../elements/outdated.tsv > outdated-hunspell-failed.txt hunspell -d ../nl -L -1 ../elements/stress.tsv > stress-hunspell-failed.txt -hunspell -d ../nl -L -1 ../../opentaal-wordlist/wordparts.tsv > wordparts-hunspell-failed.txt -hunspell -d ../nl -G -1 ../../opentaal-wordlist/corrections.tsv > corrections-hunspell-failed.txt +hunspell -d ../nl -L -1 ../../opentaal-wordlist/elements/wordparts.tsv > wordparts-hunspell-failed.txt +hunspell -d ../nl -G -1 ../../opentaal-wordlist/elements/corrections.tsv > corrections-hunspell-failed.txt hunspell -d ../nl -L ../../opentaal-wordlist/wordlist.txt > wordlist-hunspell-failed.txt #TODO remove excluded from last file -#nuspell -d ../nl -G -1 ../elements/obsolete.tsv > obsolete-nuspell-failed.txt -#nuspell -d ../nl -G -1 ../elements/outdated.tsv > outdated-nuspell-failed.txt -#nuspell -d ../nl -L -1 ../elements/stress.tsv > stress-nuspell-failed.txt -#nuspell -d ../nl -L -1 ../../opentaal-wordlist/wordparts.tsv > wordparts-nuspell-failed.txt -#nuspell -d ../nl -G -1 ../../opentaal-wordlist/corrections.tsv > corrections-nuspell-failed.txt -nuspell -d ../nl -l ../../opentaal-wordlist/wordlist.txt > wordlist-nuspell-failed.txt +if [ -z $(which nuspell) ]; then + echo 'Please, install Nuspell (from their PPA) with sudo apt-get install nuspell' +fi + +awk -F '\t' '{print $1}' ../elements/obsolete.tsv | nuspell -d ../nl -G > obsolete-nuspell-failed.txt 2> /dev/null +awk -F '\t' '{print $1}' ../elements/outdated.tsv | nuspell -d ../nl -G > outdated-nuspell-failed.txt 2> /dev/null +awk -F '\t' '{print $1}' ../elements/stress.tsv | nuspell -d ../nl -L > stress-nuspell-failed.txt 2> /dev/null +awk -F '\t' '{print $1}' ../../opentaal-wordlist/elements/wordparts.tsv | nuspell -d ../nl -L > wordparts-nuspell-failed.txt 2> /dev/null +awk -F '\t' '{print $1}' ../../opentaal-wordlist/elements/corrections.tsv | nuspell -d ../nl -G > corrections-nuspell-failed.txt 2> /dev/null +nuspell -d ../nl -l ../../opentaal-wordlist/wordlist.txt > wordlist-nuspell-failed.txt 2> /dev/null #TODO remove excluded from last file + +wc -l *txt