Attribute (Atrybut)
Fundamenty teoretyczneAttribute (Atrybut) to cecha opisująca encję w modelu EAV – konkretna właściwość lub fakt powiązany z bytem tematycznym. Atrybuty klasyfikuje się jako UNIQUE (wyróżniki), ROOT (cechy definicyjne, zawsze obecne) i RARE (dodatkowe, rzadko pokrywane). Kolejność prezentacji w tekście jest obowiązkowa: UNIQUE na górze (H1, lead), ROOT w środku (H2), RARE na dole (H3, FAQ). Filtracja atrybutów odbywa się przez trójkryterium RPP: Relevance, Prominence, Popularity – wszystkie trzy warunki muszą być spełnione jednocześnie.
Na przykład dla encji Kortyzol atrybut 'hormon stresu' jest UNIQUE (wyróżnik), 'typ hormonu' jest ROOT (definicja), a 'kortyzol a płodność' jest RARE (pokrywany przez 1/10 stron).
W praktyce użyj skilla Attribute Classifier, aby automatycznie sklasyfikować atrybuty wyciągnięte przez narzędzie do ekstrakcji EAV – to determinuje strukturę całego artykułu.