Skip to content

Commit

Permalink
housekeeping and testing
Browse files Browse the repository at this point in the history
  • Loading branch information
PanderMusubi committed Dec 29, 2020
1 parent 8f8f1b5 commit 79a9ec0
Show file tree
Hide file tree
Showing 2 changed files with 24 additions and 10 deletions.
7 changes: 5 additions & 2 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -29,6 +29,7 @@ De spellingcontrole bestaat, naast de documentatie en licentie, uit de volgende
bestanden:
- `nl.aff`
- `nl.dic`
- `datetimeversion.txt`

Deze zijn samengesteld en gecontroleerd met een aantal hulpbestanden:
- `../opentaal-wordlist/wordparts.tsv`
Expand All @@ -42,7 +43,6 @@ Deze zijn samengesteld en gecontroleerd met een aantal hulpbestanden:
- `elements/outdated.tsv`
- `elements/replacements.tsv`
- `elements/stress.tsv`
- `datetimeversion.txt`

De spellingcontrole bestaat uit de twee
[UTF-8 Unicode](https://nl.wikipedia.org/wiki/UTF-8) bestanden
Expand All @@ -53,7 +53,10 @@ mogelijk om van de meer dan 400.000 woorden uit de woordenlijst een woordenboek
te maken dat minder dan de helft zo groot is én informatie heeft over
vervoegingen, samenstellingen en suggesties.

Beschrijving van overige bestanden is:
De datum, de tijd en het versienummer van al deze bestanden is te vinden in
[datetimeversion.txt](datetimeversion.txt).

Beschrijving van de overige bestanden is:
- [elements/archaic.tsv](elements/archaic.tsv) (archaïsch), deze woorden zijn
die nog wel gebruikt worden, alle zitten in de woordenlijst
- [elements/excluded.tsv](elements/excluded.tsv), deze woorden moeten worden
Expand Down
27 changes: 19 additions & 8 deletions scripts/test.sh
Original file line number Diff line number Diff line change
@@ -1,15 +1,26 @@
if [ -z $(which hunspell) ]; then
echo 'Please, install Hunspell with sudo apt-get install hunspell'
exit 1
fi

hunspell -d ../nl -G -1 ../elements/obsolete.tsv > obsolete-hunspell-failed.txt
hunspell -d ../nl -G -1 ../elements/outdated.tsv > outdated-hunspell-failed.txt
hunspell -d ../nl -L -1 ../elements/stress.tsv > stress-hunspell-failed.txt
hunspell -d ../nl -L -1 ../../opentaal-wordlist/wordparts.tsv > wordparts-hunspell-failed.txt
hunspell -d ../nl -G -1 ../../opentaal-wordlist/corrections.tsv > corrections-hunspell-failed.txt
hunspell -d ../nl -L -1 ../../opentaal-wordlist/elements/wordparts.tsv > wordparts-hunspell-failed.txt
hunspell -d ../nl -G -1 ../../opentaal-wordlist/elements/corrections.tsv > corrections-hunspell-failed.txt
hunspell -d ../nl -L ../../opentaal-wordlist/wordlist.txt > wordlist-hunspell-failed.txt
#TODO remove excluded from last file

#nuspell -d ../nl -G -1 ../elements/obsolete.tsv > obsolete-nuspell-failed.txt
#nuspell -d ../nl -G -1 ../elements/outdated.tsv > outdated-nuspell-failed.txt
#nuspell -d ../nl -L -1 ../elements/stress.tsv > stress-nuspell-failed.txt
#nuspell -d ../nl -L -1 ../../opentaal-wordlist/wordparts.tsv > wordparts-nuspell-failed.txt
#nuspell -d ../nl -G -1 ../../opentaal-wordlist/corrections.tsv > corrections-nuspell-failed.txt
nuspell -d ../nl -l ../../opentaal-wordlist/wordlist.txt > wordlist-nuspell-failed.txt
if [ -z $(which nuspell) ]; then
echo 'Please, install Nuspell (from their PPA) with sudo apt-get install nuspell'
fi

awk -F '\t' '{print $1}' ../elements/obsolete.tsv | nuspell -d ../nl -G > obsolete-nuspell-failed.txt 2> /dev/null
awk -F '\t' '{print $1}' ../elements/outdated.tsv | nuspell -d ../nl -G > outdated-nuspell-failed.txt 2> /dev/null
awk -F '\t' '{print $1}' ../elements/stress.tsv | nuspell -d ../nl -L > stress-nuspell-failed.txt 2> /dev/null
awk -F '\t' '{print $1}' ../../opentaal-wordlist/elements/wordparts.tsv | nuspell -d ../nl -L > wordparts-nuspell-failed.txt 2> /dev/null
awk -F '\t' '{print $1}' ../../opentaal-wordlist/elements/corrections.tsv | nuspell -d ../nl -G > corrections-nuspell-failed.txt 2> /dev/null
nuspell -d ../nl -l ../../opentaal-wordlist/wordlist.txt > wordlist-nuspell-failed.txt 2> /dev/null
#TODO remove excluded from last file

wc -l *txt

0 comments on commit 79a9ec0

Please sign in to comment.