-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathelasticsearch
118 lines (101 loc) · 4.52 KB
/
elasticsearch
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
Datenstruktur in ES
Aufgabe: Es sollen alle Dokumente/Inhalte des Stadtrates erfasst und schnell duchsuch- und arrangierbar sein.
Problem: Dokumente haben keinen Text, enthaltener Text steht nur unstrukturiert zur Verfügung oder viele Textteile mit Strukturinformationen stehen zur verfügung.
Lösung: Verteilung der Dokumente und deren Teile auf verschiedene Typen (ähnlich den Tabellen bei SQL-DBs)
#Sitzungen
Enthält bekannte Sitzungsdokumente
Index: ratsinfo
DocType: sitzungen
Aufbau
{
"id" : "auto increment",
"dl_datum" : 1455297075, //unix timestamp
"nr" : "FL/019/2016", //Nummer der Sitzung (Kann auch mal: "UK/FB/SE/016/2016" sein!)
"gremium" : "Stadtrat", //Name des Tagenden Gremiums
"wperiode" : 20092014, //einklammernde Wahlperiode zB:2009-2014
"titel" : "xy Sitzung SR", //Titel der Sitzung
"sitzung" : "823", // = http://ratsinfo.dresden.de/to0040.php?__ksinr=823
"ort" : "Rathaus Dresden" //Sitzungsort
"start" : 1455297075,
"ende" : 1455297076,
"wortanzahl: " 2023, //Wortanzahl
"dokumente" : //zur Sitzung gehörende Dokumente. Einladung, Beschlussempfehlung etc.
[{
"dateiname" : "00004632.pdf"
"titel" : "Vorlage Gremium"
"text" : "lorem ipsum" //voller Text des Dokuments
},
{..} //weiteres Dokument
],
"top" :
[{
"nr" : 1 //die feste Nummer des TOPs lt. Sitzung
"titel" : "Königsbrücker.." //Titel des TOPs
"vorgang" : "V0852/15" //wenn vorhanden, die Vorgangsnummer
"beschluss" : "Zustimmung" //wenn vorhanden, der Bechluss
"abstimmung" : [15,3,7] //wenn vorhanden Beschluss vohanden, gibts auch ein Abstimmungsergebnis (pro/conta/enthaltung)
"text" : "lorem ipsum" //enthält den vollen text aus der Niederschrift (SCHWIERIG!!!!)
"dokumente" : //Dokumente die zu dem TOP gehören
[{
"dateiname" : "00004666.pdf"
"titel" : "Anlage a)" //Titel des Dokuments
"text" : "lorem ipsum" //voller Text des Dokuments
},
{...} //weiteres Dokument
]
},
{...} //weiteres TOP
]
}
#Vorlagen/Anträge
Dokumente von denen bekannt ist das es Teile von öffentliche Vorlagen oder Anträge sind.
Index: ratsinfo
DocType: vorlagen_antraege
Aufbau
{
"id: " "auto increment",
"dok_id: " "00043173", //download_id
"dl_datum" : 1455297075 //unix timestamp
"titel: " "V0774/15" //Titel der Vorlage/des Antrags zu der das Dokument gehört
"langtitel: " "Vorlage Gremien" //titel des Dokuments. Zb. auch "Beschluss" oä.
"text: " "lorem impsum.." //volltext des Dokuments mit allen seiten
"wortanzahl: " 1023 //Wortanzahl
}
#Anfragen
freigegebene Anfragen
Index: ratsinfo
DocType: anfragen
Aufbau
{
"id: " "auto increment",
"dok_id: " "00043173", //download_id
"dl_datum" : 1455297075 //unix timestamp
"nr: " "mAF0084/16" //Nummer der Anfrage
"wperiode" : 20092014 //einklammernde Wahlwperiodee zB:2009-2014
"titel: " "Königsbrücker" //Gegenstand der Anfrage. Ähnlich einem Titel
"wer" : "Peter Lustig" //Name der Antragstellenden Person
"partei" : "FDP/FB" //Fragende Partei
"when: " 1455297075 //Datum der Befragung (meistens das Datum der stattfindenden Sitzung)
"anfrage"
{
"text: " "lorem impsum.." //volltext des Dokuments mit allen seiten
"wortanzahl: " 1023 //Wortanzahl
}
"antwort: "
{
"text: " "lorem impsum.." //volltext des Dokuments mit allen seiten
"wortanzahl: " 1023 //Wortanzahl
}
}
#Vorgänge
Enthält bekannte Vorgänge. Ist mehr eine MetaTabelle. Da jede Vorgangsnummer schon in den betreffenden SitzungsTOPs vermerkt sind.
Index: ratsinfo
DocType: vorgaenge
Aufbau
{
"id" : "auto increment",
"name" : "V0774/15" //Name des Vorgangs zu der das Dokument gehört
"art" : "Vorlage" //Art des Vorganges
"Bearbeitung" : //Sitzungen zu denen der Vorgang bearbeitet wurde
["Id/Nr","Id/Nr", ...] //Id der Sitzung, Nummer des TOPs
}