Název projektu
Inovatívne geoinformatické metódy pre monitoring distribúcie a pohybu ľudí
Kód
SP2022/107
Předmět výzkumu
V súčasnosti sa skúmajú rôzne metódy pre sledovanie prítomnosti ľudí mimo svojho bydliska (známe z cenzových šetrení a evidencie obyvateľstva). Ide o metódy založené na sledovaní mobilných telefónov, sociálnych sietí, kamerových systémov, diaľkového prieskumu Zeme. Z týchto metód boli vybrané 2 komplementárne oblasti, a to sociálne siete a DPZ s veľmi vysokým priestorovým rozlíšením. Každá z oblastí rieši dynamiku populácie v inej časovej a priestorovej mierke. Sociálne siete umožňujú sledovať mobilitu na strednej úrovni priestorového rozlíšenia, avšak s vysokým časovým rozlíšením, zatiaľ čo DPZ umožňuje skúmať mobilitu na veľmi vysokom priestorovom rozlíšení, ale s obmedzeným časovým rozlíšením. Zo sociálnych sietí bola vybraná sieť Twitter vzhľadom k dostupnosti dát, polohy, dobrého spracovania textov a povahy siete.
Cieľom výskumu je zhodnotiť možnosti vyhodnotenia (dynamickej populácie) pomocou metód analýzy príspevkov zo siete Twitter a DPZ s veľmi vysokým rozlíšením v mestskom prostredí. Vyhodnotiť mobilitu vo vybraných mestách ako Praha, Londýn a Madrid. Zameranie bude prevedené na dopravné chovanie indikované na sociálnych sieťach a následne interpretovaná dynamika populácie. Pomocou DPZ bude prebiehať vyhodnotenie zmien v priebehu času v mikromierke a ohodnotenie dynamiky populácie v mikromierke pre oblasť centra Ostravy a Prahy.
V súčasnosti sa sleduje mobilita ľudí pomocou sociálnych sietí najmä v súvislosti s COVID19 pandémiou [6, 8-9]. Spolu s mobilitou je možné skúmať aj relatívne napojenie jednotlivých mestských častí na seba prípadne ich socioekonomickú či rasovú podobnosť [7-10]. Vo všetkých prípadoch sa pracuje s geokódovanými tweetmi (polohová zložka čerpaná z metadát tweetu). K hodnoteniu obsahu tweetov sa používajú metódy spracovania prirodzeného jazyka. Ide o sémantické analýzy, LDA modelovanie topikov [12]. Na sledovanie vývoja ich polohovej zložky v čase sa používa metóda sledovania vývoja polohy v čase. Môže ísť o metódy nazývané “Single-day distance” a “Cross-day distance”, prípadne určovania normalizovaného indexu mobility [13]. Pri práci s tweetmi sa odporúča nastaviť rôzne limitné hodnoty napr. aby boli vybratí len užívatelia s viac ako dvoma príspevkami za deň rovnako ako aby vzdialenosť dvoch polôh bola viac ako 0.5 km [8]. Ďalšou formou predspracovania je výber len tých tweetov, ktoré majú vyššie priestorové rozlíšenie ako je úroveň mesta prípadne odstránenie tweetov uverejnených automaticky napr. ponuky práce, výluky na trati [13]. Výskum sa zameria na metódy geokódovania, analýzy časopriestorovej dynamiky populácie, diferenciáciu tém vo vzťahu k mobilite v časoch pandémie. Jeho dôležitým aspektom je taktiež medzinárodné zrovnanie prístupov a výsledkov časopriestorových analýz.
Druhou skúmanou oblasťou je štúdium dynamiky populácie v mikromierke. Pozemné kamerové systémy majú obmedzené pokrytie priestoru a prístup k nim je obmedzený. Rýchlo sa rozvíjajúce schopnosti leteckých a družicových systémov DPZ umožňujú lepšie plošne monitorovať situáciu. Rozlíšenie satelitných snímok stále nestačí na to, aby bolo možné detekovať spoľahlivo individuálne každého človeka. Napriek tomu zmeny intenzity, textury, farebných tónov v mieste výskytu ľudí (hlavne skupín) umožňujú také mapovanie. [1] navrhuje algoritmus, ktorý je založený na lokálnych vlastnostiach, ktoré sú extrahované z pásiem intenzity a farieb satelitného obrazu. Na druhej strane stojí detekcia objektov pomocou modelov hlbokého učenia. Tieto modely dokážu poskytnúť lepšiu presnosť, menšiu spotrebu času, menšiu zložitosť a celkovo poskytnú lepší výkon. Medzi najvyužívanejšie neurónové siete, ktoré sa zaoberajú detekciou objektov, patria CNN. Medzi najvýkonnejšie algoritmy detekcie objektov CNN patria RCNN (Region-based Convolution Neural Network), Fast RCNN, Faster RCNN, SSD (Single Shot Multibox Detector) a YOLO (You Look Only Once) [2]. Z dôvodu práce v heterogénnom prostredí (mestská zástavba), kde pozadie a detekované objekty sú dosť podobné, je vhodné pre detekciu v takomto prostredí použiť jeden zo spomenutých algoritmov, poprípade vytvorenie vlastnej CNN. Faster RCNN použili [2], [3] pri detekcií ich záujmových objektov. Dôležité je pre neurónové siete rozdelenie snímok na testovaciu fázu, trénovaciu a validačnú. Vzhľadom na využitie architektúry CNN bude potrebné dostatočne veľké množstvo dát, čo je veľmi obtiažne vzhľadom na cenu komerčných družicových snímok, ktoré budú využívané na spracovanie [2]–[5]. Budú sa používať družicové snímky WorldView -3 a WorldView -4 a to z dôvodu najlepšieho rozlíšenia, ktoré môžu komerčné zdroje poskytnúť. Preto bude dôležitým krokom spracovania tzv. zväčšenie údajov rôznymi technikami (zmena mierky, rotácia, horizontálne preklopenie atď.). Ďalšou možnosťou detekcie pomocou CNN je tvorba vlastnej CNN tak ako v prípade [4]. Vo všetkých prípadoch je presnosť detekcie pomocou spomenutých techník na veľmi vysokej úrovni a to na úrovni 78% až 94% [2]–[4]. Na spracovanie sa bude používať programovací jazyk Python. Výhodou tohoto jazyka je, že spolupracuje s mnohými knižnicami, ktoré sú odporúčané práve na hlboké učenie. Medzi takéto knižnice patrí TensorFlow, Keras, Caffe, Torch či OpenCV, ktoré budú využívané [5]. Detekcia ľudí zo satelitných dát nie je zatiaľ ani v literatúre príliš riešená. Vo väčšine sú záujmovými objektami autá, budovy poprípade stromy či živočichy [1].
Syntéza poznatkov z oboch častí vyskumu dovolí zhodnotit výhody a nevýhody jednotlivých prístupov a posúdiť možnosti integrácie do komplexných urbánnych informačných systémov, predstavujúcich kostru smart city. Takový význam je dôůležitý napr. pre krízové riadenie, policajné zložky, bezpečnostné analýzy a riešenia, dopravné úlohy, sledovanie mobility ľudí a iné socioekonomické úlohy [11]. Projekt je veľmi dôležitý pre získavanie poznatkov o metódach vyhodnocovania mobility ľudí, spracovaní big data a prúdov crowdsourced geodát, využití neurónových sietí pre detekciu obyvateľstva z družicových snímok.
Zodpovedným riešiteľom projektu je Ing. Martin Zajac, ktorý sa zaoberá problematikou spracovania dát zo sociálnych sietí, geoparsingu dát zo sociálnych sietí a spracovaniu prirodzeného jazyka, ktoré priamo súvisia s riešeným projektom. Témou jeho DiP je “Geoparsing a priestorový kontext príspevkov na sociálnych sieťach”. V rámci predchádzajúceho bakalárskeho a magisterského štúdia absolvoval predmety s problematiou spracovania geodát, priestorovej analýzy dát a priestorovej štatistiky a taktiež sa venoval tejto problematike aj počas svojej diplomovej práce na tému “Čaropriestorová analýza dát zo sociálnych sietí vo vzťahu k verejnej doprave”. V minulosti sa zúčastnil projektu SGS zameraného na detekciu pohybu obyvateľstva pomocou snímok veľmi vysokého rozlíšenia. Školitel doc. Dr. Ing. Jiří Horák sa taktiež zaoberá problematikou spracovania crowdsourced geodát a geoparsingom rovnako jako problematikou DPZ, konkrétne objektovo-orientovanou klasifikáciou a využitím metód umelej inteligencie. Súčasťou riešitelského týmu je ďalší interný doktorant a 2 študenti naväzujúceho magisterského štúdia a ich role v projekte korešpondujú so zameraním ich dizertačných, resp. diplomových prác. Ing. Peter Golej sa zaoberá analýzou dát DPZ pomocou pokročilých metód spracovania takých dát. Taktiež sa zaoberá analýzou dát pomocou neurónových sietí, hlavne pomocou CNN. Obe metódy analýzy dát DPZ súvisia priamo s riešným projektom. Témou jeho DiP je“ Sledování toků lidí a dopravy na základě družicových pozorování“; Bc. Marek Ilenčík sa zaoberá strojovím učením. Téma jeho diplomovej práce je “Využití Street View a Družicových snímků pro odhad cen nemovitostí.” Má kvalitné znalosti v jazyku python v databázových nástrojoch a na vysokej úrovni ovláda databázový jazyk SQL a jeho priestorové rozšírenie. ; Bc. Kateřina Rutová – Sa vo svojom bakalárskom štúdiu venovala problematike diaľkového prieskumu zeme. V súčasnosti sa venuje problematikám vizualizácie a 3D vizualizácie. Témou jej diplomovej práce je “Možnosti 3D vizualizace v GIS pro potřeby aplikace Pátrač”. Taktiež má kvalitné znalosti v práci s GIS softvérom, priestorovými databázami a programovaním pre potreby GIS.
Použitá literatura:
[1] B. Sirmacek a P. Reinartz, „AUTOMATIC CROWD ANALYSIS FROM VERY HIGH RESOLUTION SATELLITE IMAGES-Web of Science Core Collection". https://www.webofscience.com/wos/woscc/full-record/WOS:000358311000029 (viděno pro. 08, 2021).
[2] S. Rawat, „Airplanes Detection for Satellite using Faster RCNN", Medium, pro. 09, 2019. https://towardsdatascience.com/airplanes-detection-for-satellite-using-faster-rcnn-d307d58353f1 (viděno pro. 08, 2021).
[3] I. Duporge a O. Isupova, „Using very‐high‐resolution satellite imagery and deep learning to detect and count African elephants in heterogeneous landscapes - Duporge - 2021 - Remote Sensing in Ecology and Conservation - Wiley Online Library". https://zslpublications.onlinelibrary.wiley.com/doi/full/10.1002/rse2.195 (viděno pro. 08, 2021).
[4] D. S, S. Kumar, a D. S. L, „Detection and Classification of Objects in Satellite Images using Custom CNN", Int. J. Eng. Res. Technol., roč. 10, č. 6, čer. 2021, Viděno: pro. 15, 2021. [Online]. Dostupné z: https://www.ijert.org/research/detection-and-classification-of-objects-in-satellite-images-using-custom-cnn-IJERTV10IS060287.pdf, https://www.ijert.org/detection-and-classification-of-objects-in-satellite-images-using-custom-cnn
[5] K. Hacıefendioğlu, H. B. Başağa, a G. Demir, „Automatic detection of earthquake-induced ground failure effects through Faster R-CNN deep learning-based object detection using satellite images", Nat. Hazards, roč. 105, č. 1, s. 383–403, led. 2021, doi: 10.1007/s11069-020-04315-y.
[6] Applied Artificial Intelligence Institute (A2I2), Deakin University, Melbourne, VIC, Australia et al., “Geolocated Twitter-Based Population Mobility in Victoria, Australia, during the Staged COVID-19 Restrictions,” 22nd ed. (Critical Care and Resuscitation, December 7, 2020), https://doi.org/10.51893/2020.4.SC1;
[7] Cate Heine et al., “Analysis of Mobility Homophily in Stockholm Based on Social Network Data,” ed. Wenjia Zhang, PLOS ONE 16, no. 3 (March 9, 2021): e0247996, https://doi.org/10.1371/journal.pone.0247996;
[8] Chengbo Zeng et al., “Spatial-Temporal Relationship Between Population Mobility and COVID-19 Outbreaks in South Carolina: Time Series Forecasting Analysis,” Journal of Medical Internet Research 23, no. 4 (April 13, 2021): e27045, https://doi.org/10.2196/27045;
[9] Yuqin Jiang, Xiao Huang, and Zhenlong Li, “Spatiotemporal Patterns of Human Mobility and Its Association with Land Use Types during COVID-19 in New York City,” ISPRS International Journal of Geo-Information 10, no. 5 (May 18, 2021): 344, https://doi.org/10.3390/ijgi10050344;
[10] Jennifer Candipan et al., “From Residence to Movement: The Nature of Racial Segregation in Everyday Urban Mobility,” Urban Studies 58, no. 15 (November 2021): 3095–3117, https://doi.org/10.1177/0042098020978965;
[11] Caitrin Armstrong et al., “Challenges When Identifying Migration from Geo-Located Twitter Data,” EPJ Data Science 10, no. 1 (December 2021): 1, https://doi.org/10.1140/epjds/s13688-020-00254-7.
[12] Di Wang et al., “Real-Time Traffic Event Detection From Social Media,” ACM Transactions on Internet Technology 18, no. 1 (November 4, 2017): 1–23, https://doi.org/10.1145/3122982.
[13] Xiao Huang et al., “Twitter Reveals Human Mobility Dynamics during the COVID-19 Pandemic,” ed. Song Gao, PLOS ONE 15, no. 11 (November 10, 2020): e0241957, https://doi.org/10.1371/journal.pone.0241957.
Pracovný harmonogram je možné dohľadať v priečinku projektovej dokumentácie pod názvom Ganttov diagram.
Rozpočet
Požadavek: 300 000
Stipendia: 96 000
Odpovědný řešitel projektu: 3000 Kč/mesiac
Ostatní řešitelé: Ing. Peter Golej 3000 Kč/mesiac ako hlavný spoluriešiteľ, ostatní 1000 Kč/mesiac
Materiálové náklady: 10 000 – nákup spotrebného materiálu, tonery, kancelárske potreby a papier
DHaNM: 30 000 – Nákup PC komponent (laserová tlačiareň, príslušenstvo k PC (širokouhlý monitor s vysokým rozlíšením pre efektívnu prácu s družicovými snímkami veľmi vysokého rozlíšenia, pamať RAM – analýza veľko-objemných dát, disky na zálohovanie veľko-objemných dát, SSD pamäte)
Služby: 59 000 – nákup dát WorldView-3 alebo WorldView-4 (25 km2 cca 11 000 bez DPH) SW Geomatica (6500 bez DPH) (poprípade ENVI – 10 500 bez DPH), poplatky za preklad, publikovanie v odbornom časopise
Cestovní náklady: 60 000 – Dve aktívne účasti na konferencii CSUM. Výjazd na konferenciu CSUM 2022 Skiathos, Grécko. V prípade že nebude možné vycestovať na konferenciu, bude konferencia vedená on-line. Prostriedky z cestovného bude presunuté na služby a na posilnenie nákupu ďalších družicových dát.
Konference: VŠB-TUO: 15 000 - náklady na organizaci studentské vědecké konference Gisáček 2022 (získání přehledu k různým formám využití strojového učení a zkušenosti s nimi, zpětná väzba k prezentované metodice projektu na národní úrovni)
Režie: 30 000
Historické působení na přecházejících projektech
Ing. Martin Zajac
Detekcia pohybu obyvateľstva pomocou snímok veľmi vysokého rozlíšenia.
Rok:2021
Finančné prostriedky: 335 000 Kč
Ing. Martin Zajac na projekte manuálne detekoval prvky z dátového modelu na snímkach veľmi vysokého rozlíšenia.
Využitie Globálnych navigačných družicových systémov pre podporu meteorologického nowcastingu Rok: 2020
Finančné prostriedky: 193 000 Kč
Ing. Martin Zajac pracoval na projekte SGS, kde sa zaoberal hodnotením charakteristík atmosféry.
Ing. Peter Golej
Názov: Detekcia pohybu obyvateľstva pomocou snímok veľmi vysokého rozlíšenia.
Rok: 2021
Finančné prostriedky: 335 000 Kč
Publikácie: GOLEJ, P. ORLIKOVA, L. HORAK, J. LINHARTOVA, P. STRUHAR, J. Detection of people and vehicles using very high-resolution satellite images, 21. International Multidisciplinary Scientific GeoConference Surveying, Geology and Mining, Ecology and Management, 2021 – ešte neprebehla indexácia
GOLEJ, P. HORAK, J. Comparison of vehicles detection using very high-resolution satellite images, GIS Ostrava 2022 – Earth Observation for Smart City and Smart Region – ešte neprebehla indexácia
Ing. Peter Golej pracoval na projekte, kde sa zaoberal rôznymi pokročilými metódami spracovania obrazových dát DPZ a zaoberal sa aj analýzou obrazu pomocou neurónových sietí.
Názov: Monitorovanie zmien terénu pomocou radarovej interferometrie a UAV
Rok: 2019
Finančné prostriedky: 430 000 Kč
Publikácie: ŠÁDEK, P. STRUHÁR, J. Volume computation of municipal landfill - Comparing GNSS and UAV. 40th Asian Conference on Remote Sensing, ACRS 2019: "Progress of Remote Sensing Technology for Smart Future". Neuvedeno : Asian Association on Remote Sensing, 2020, s. nestránkováno
RAPANT, P. STRUHÁR, J. LAZECKÝ, M. Radar interferometry as a comprehensive tool for monitoring the fault activity in the vicinity of underground gas storage facilities. Remote Sensing, 2020, roč. 12, č. 2, s. 271.
ŠÁDEK, P. STRUHÁR, J. The evaluation of water pollution with the help of remote sensing tools. International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences - ISPRS Archives. Volume 42, Issue 3/W8. Hannover : International Society for Photogrammetry and Remote Sensing, 2019, s. 403-408.Ing. Peter Golej pracoval na tomto projekte SGS, kde sa zaoberal problematikou DPZ a využíval potrebné znalosti z tejto problematiky na riešenie čiastočných úloh a to konkrétne úprava a spracovanie družicových snímok.
Bc. Marek Ilenčík
Názov: Detekcia pohybu obyvateľstva pomocou snímok veľmi vysokého rozlíšenia.
Rok: 2021
Finančné prostriedky: 335 000 Kč
Bc. Marek Ilenčík na projekte manuálne detekoval prvky z dátového modelu na snímkach veľmi vysokého rozlíšenia.
Bc. Kateřina Rutová
Bez predošlých pôsobení na projektoch SGS.
Rok zahájení
2022
Rok ukončení
2022
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Kategorie
SGS
Typ
Specifický výzkum VŠB-TUO
Řešitel