IDRR_data

The data of IDRR (Implicit Discourse Relation Recognition), including PDTB2, PDTB3 and CoNLL16.

To get dataframe easily.

cd IDRR_data
pip install -e .

Data

columns of csv

'arg1', 'arg2', 'conn1', 'conn2', 
'conn1sense1', 'conn1sense2', 'conn2sense1', 'conn2sense2',
'relation', 'split', 'data_id'

get dataframe from IDRRDataFrames in dataframe.py
new columns

'index', 'arg1', 'arg2', 'conn1', 'conn2', 
'conn1sense1', 'conn1sense2', 'conn2sense1', 'conn2sense2', 
'relation', 'split', 'data_id', 
'label11', 'label11id', 'label12', 'label12id', 
'label21', 'label21id', 'label22', 'label22id', 
'ans_word1', 'ans_word1id', 'ans_word2', 'ans_word2id'

Preprocess

connXsenseY -> labelXY, labelXYid
connX -> ans_wordX, ans_wordXid
filter relation ['Explicit', 'Implicit']
filter split ['train', 'dev', 'test', 'blind-test']

Raw Resource

PDTB2

https://github.com/cgpotts/pdtb2

https://catalog.ldc.upenn.edu/LDC2008T05

PDTB3

https://github.com/najoungkim/pdtb3

https://catalog.ldc.upenn.edu/LDC2019T05

CoNLL16

https://github.com/attapol/conll16st

https://www.cs.brandeis.edu/~clp/conll16st/dataset.html

Preprocess

https://github.com/najoungkim/pdtb3/blob/master/preprocess/preprocess_pdtb3.py

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
src		src
.gitignore		.gitignore
README.md		README.md
VERSION		VERSION
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IDRR_data

Data

Preprocess

Raw Resource

About

Releases

Packages

Contributors 3

Languages

ZpWang-AI/IDRR_data

Folders and files

Latest commit

History

Repository files navigation

IDRR_data

Data

Preprocess

Raw Resource

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages