-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Fuzzy matches should exclude interpunction and upper/lower casing switching #67
Comments
@vmenger, ik ben bezig met dit issue. Ik zag overigens dat clinlp -> src/clinlp is verplaatst :) p.s. of is het deze issue, naja he |
Cool, goed om te weten! De hele roadmap staat nu hier: https://github.com/orgs/umcu/projects/3 -- is gelijk wat uitnodigender naar externen die mee willen werken. Vul gerust aan (door issues aan te maken |
thinking out loud/notitie: Het niet accepteren van case switching voor de fuzzy matching vereist een nieuw gecompileerde Levenshstein. |
Als alles goed werkt dan kijkt de fuzzy matching alleen binnen een token, was het niet de proximity matching die hier de interpunctie matchte? In dat geval is het wel makkelijker te fixen, door |
First this span
is tagged as positive, then this span
is tagged as negative.
The relevant phrases in the concept dictionary are:
positive:
Longembolieën beiderzijds
negative:
Geen longembolieën
with the following clinlp settings:
Expected behavior
Longembolieën beiderzijds
is respectedDirection of solution:
IS_PUNCT
option as a pattern attribute.The text was updated successfully, but these errors were encountered: