wiadomościksięgarniaprenumeratareklamakontaktRODOpolityka prywatności
Najnowsze wydarzenia z dziedziny geodezji, nawigacji satelitarnej, GIS, katastru, teledetekcji, kartografii. Nowości rynkowe, technologiczne, prawne, wydawnicze. Konferencje, targi, administracja.
blog
|2019-09-19| GIS, Software

Co po szejpie?

Mimo swojej archaiczności Shapefile wciąż pozostaje najpopularniejszym formatem wymiany danych przestrzennych na świecie. Ale jego dni wydają się policzone (nie nadaje się dla danych złożonych, nietypowych i obszernych). Zatem co go zastąpi? Piszemy o tym we wrześniowym wydaniu miesięcznika GEODETA.


Co po szejpie?
Zapis danych wektorowych w pliku SHP został wprowadzony przez firmę Esri do jej oprogramowania Arc­View jeszcze na początku lat 90., a więc w czasach, gdy GIS był na świecie mało znanym skrótem. Można przypuszczać, że to właśnie wczesne wypuszczenie formatu w połączeniu ze sporą popularnością produktów Esri zadecydowało o międzynarodowym sukcesie „szejpa”. Popularność tego rozwiązania pozostawała niezachwiana przez lata mimo ostrej konkurencji ze strony innych aplikacji GIS-owych – zarówno komercyjnych, jak i otwartych. Niewiele zmieniły tu nawet wysiłki standaryzacyjne Open Geospatial Consortium, które stworzyło tak popularne w geoinformatyce standardy, jak WMS czy WFS. Szybki postęp technologiczny w GIS-ie sprawia jednak, że wady i ograniczenia formatu SHP stają się dla użytkowników coraz bardziej dokuczliwe.

• Akt oskarżenia

Pierwszą wadę SHP dostrzeże nawet laik – jedna warstwa zapisywana jest do kilku plików. Zgodnie ze specyfikacją formatu są ich przynajmniej trzy (rozszerzenia SHP, DBF, SHX), choć opcjonalnie listę tę można rozszerzyć nawet o 7 kolejnych. Nie dość, że praca z takim „bogactwem” jest niewygodna, to powszechne są sytuacje, że mniej doświadczony użytkownik na prośbę: „prześlij mi szejpa”, wysyła tylko jeden – kompletnie nieprzydatny – plik.

Kolejną wadą jest ograniczony do 2 GB rozmiar pliku, co przekłada się na nie więcej niż kilkadziesiąt milionów rekordów. Nikomu to nie przeszkadzało w latach 90., gdy królowały dyskietki, ale w erze big data stanowi już poważne ograniczenie.

Tych ograniczeń w „szejpie” jest zresztą znacznie więcej. No bo dlaczego obiekt nie może mieć więcej niż 255 atrybutów, a nazwa każdego z nich nie może przekraczać 10 znaków? Dlaczego dopuszczalne atrybuty to tylko: tekst (i to ograniczony do raptem 254 znaków), data (bez możliwości zapisu czasu) oraz liczba całkowita bądź ułamek (tylko do 13 znaków). A co np. z „dymkami” czy obrazkami?

Do wad SHP zaliczana jest także możliwość zapisu w jednym pliku tylko jednego rodzaju geometrii – punktu, multipunktu, linii lub poligonu. Pamiętać również należy, że standard ten służy wyłącznie do przechowywania danych wektorowych. Nie da się zatem zapisać w tym rozszerzeniu np. rastrów. Ponadto „szejp” nie pozwala opisywać relacji topologicznych. A możliwości zapisu tak popularnych obecnie danych 3D są w nim mocno ograniczone.

Do listy bolączek można jeszcze dodać problemy z obsługą znaków diakrytycznych i definicji...

Pełna treść artykułu we wrześniowym wydaniu miesięcznika GEODETA

• Zamów wersję papierową • Zamów wersję cyfrową

Redakcja


«« powrót

dodaj komentarz

KOMENTARZE Komentarze są wyłącznie opiniami osób je zamieszczających i nie odzwierciedlają stanowiska redakcji Geoforum. Zabrania się zamieszczania linków i adresów stron internetowych, reklam oraz tekstów wulgarnych, oszczerczych, rasistowskich, szerzących nienawiść, zawierających groźby i innych, które mogą być sprzeczne z prawem. W przypadku niezachowania powyższych reguł oraz elementarnych zasad kultury wypowiedzi administrator zastrzega sobie prawo do kasowania całych wpisów. Użytkownik portalu Geoforum.pl ponosi wyłączną odpowiedzialność za zamieszczane przez siebie komentarze, w szczególności jest odpowiedzialny za ewentualne naruszenie praw lub dóbr osób trzecich oraz szkody wynikłe z tego tytułu.

komentarze news_pl
Zmierzch SHP Chcemy modelować coraz bardziej skomplikowaną rzeczywistość i otrzymywać o niej dane za pomocą coraz prostszych środków (formatów) ... tego nie da się pogodzić :/

big data Flow, lepiej pociśnij czytanie ze zrozumieniem i frazeologię. "w erze big data" to nie znaczy, że konkretnie w big data są te pliki wykorzystywane.

A gdzie tutaj jest mowa o big data ?

Big W którym miejscu w bigdata używa się plików z danymi i te pliki mają wpływ na analizy?! Piękny pocisk wiedzy...

@PeCet kolega chyba nowy na forum.... GML nie służy do prowadzenia na nim analiz. Służy tylko i wyłącznie do transferu danych. Jak wykorzystujesz go w innych sposób to jest Twoja sprawa i Twój problem. Tych wad nikt nie zneutalizował w SHP, tylko wprowadził nowy format - geobazę. Nie można powiedzieć że naprawiłem swojego 18 letniego golfa poprzez wymianę go na 12 letniego passata. Po prostu zmieniłem samochody.

A słyszałeś kiedyś np o rasterlite ?

Na dziś to może i ma masę wad i jest przestarzały (część wad wymienionych powyżej częściowo zneutralizowano poprzez wprowadzenie geobaz) powodzenia natomiast życzę w wykonywaniu skomplikowanych analiz przestrzennych (z udziałem różnych typów zmiennych) na rastrach. W mojej praktyce wygląda to w ten sposób że rastra robię shp-a, i na tym wykonuję analizę przestrzenną. Alternatywą jest co prawda zagłębienie się w Grass'a lub SAG'ę, ale jest to raczej zabawa dla tych co mają nadmiar czasu wolnego.

Natomiast format który próbuje zastąpić shp to geopackage tyle że niestety posiada on już rożne zapisy metadanych w środku w tym np. dla ESRI. Z tego też względu mogą być problemy z czytaniem tego formatu zależne od tego jak został zdefiniowany w programie natywnym i jakiego sterownika używa się do jego czytania, i jak bardzo zaawansowane struktury danych ma zapisane w sobie. Jako że geopackage to spatialite niektórzy próbują go tak traktować i nie do końca mogą być z tego formatu potem zadowoleni.

GML ja akurat zajmuję się GISem jakieś 18 lat i powiem Ci że do pewnych zastosowań GML jest praktycznie nie do zastąpienia np. przechowywanie obiektowych danych hierarchicznych czy dynamicznych połączeń do zewnętrznych danych. Co do tego czego też nienawidzisz to zważ że codziennie tego używasz. Plik docx to zip z xml, plik odt to zip z xml, jednolity plik kontrolny to xml, importy i eksporty z wielu programów to xml, autodesk miał już lata temu swój landxml. Tyle że nikt nie chce żebyś go edytował ręcznie bo od czytania i przetwarzania tych danych są narzędzia. Natomiast część schematów XSD i to co oferuje GUGIk czy dane np. EMUiA są oferowane z błędami lub są niezgodne ze schematami i dlatego nie możesz tego przetworzyć w bardziej zaawansowanych programach. Pytanie czy to problem formatu czy jakości danych ?

@GML Bo GML nie miał być zastępstwem SHP tylko formatem otwartym WYMIANY danych pomiędzy systemami i jako taki sprawdza się nieźle. Kto pamięta wymianę danych wektorowych przed WFS (który stoi GMLem)? Nikt? No właśnie, bo jej w zasadzie nie było. Natomiast na biurka SHP jest już ewidentnie za stary i powinien być zastąpiony czymś na miarę dzisiejszych wymagań operatorów.

Widać temat na czasie... bo tutaj film o tym samym sprzed 3 dni https://www.youtube.com/watch?v=ysBQpqatmf4

@GML nie zgodzę się z totalną pomyłką GML/XML. Problem polega na tym, że środowisko nie rozumie czym jest GML. W tym szanowny przedmówca, nazywając GML formatem. GML nie jest formatem, a językiem. Konkretne schematy aplikacyjne są odpowiednikiem formatu. Zastanawiałam się kiedyś gdzie leży problem z GMLem. I wymyśliłam. Źródła problemów są dwa: a) sposób przygotowania schematów aplikacyjnych XSD (są zbyt --zamotane--) b) implementacja w programach obsługujących GMLa jest skandaliczna (bez pomyślunku, po kosztach). Te dwa elementy sprawiają, że powszechnie uważa się GMLa za coś złego. Sam GML jest OK. Słabe jest ich wykonanie (XSD) i implementacja w systemach. Byłam na szkoleniu (NOT 2017), gdzie główny twórca naszych schematów przyznał, że --implementacja to nie jego problem--. Przy takim podejściu nie ma się co dziwić, że to co powstało jest bardzo trudne do implementacji. Czasem nawet niemożliwe.

shp Systemami GIS zajmuję się do 15 lat, miałem możliwość obserwacji wielu zmian technologicznych w tym fascynacji formatami: DXF, DGN, SHP czy znienawidzony i będący totalną pomyłką GML/XML, który jest wymysłem informatyków. Często format ten trzeba edytować w NotePad ... Żaden ale to żaden format nie spełnił pokładanych w nim oczekiwań. Wyjątkiem jest shp. Proste rozwiązania są najlepsze = najtańsze do wykorzystania produkcyjnego przez standardowych użytkowników GIS.

13 komentarzy



zobacz też:



wiadomości

słowo kluczowe
kategoria
rok
archiwum
Mobilne skanowanie na Motławie
czy wiesz, że...
© 2005-2020 Geodeta Sp. z o.o.
created by BRTSOFT

O nas

  • Właścicielem portalu Geoforum.pl jest Geodeta Sp. z o.o., wydawca miesięcznika GEODETA oraz serwisu egeodeta24.pl
  • Geoforum.pl jest portalem internetowym i obszernym kompendium wiedzy na tematy związane z geodezją, kartografią, katastrem, GIS-em, fotogrametrią i teledetekcją, nawigacją satelitarną itp. Od 2005 roku na bieżąco dostarcza informacji z powyższych dziedzin i umożliwia ich komentowanie.
  • GEODETA (Magazyn Geoinformacyjny) ukazuje się od czerwca 1995 roku i jest największym oraz najbardziej popularnym polskim miesięcznikiem prezentującym aktualne zagadnienia z zakresu: geodezji, kartografii, katastru, GIS-u, fotogrametrii i teledetekcji, nawigacji satelitarnej itp.
  • GEODETA cyfrowy to elektroniczna wersja tradycyjnego wydania miesięcznika. W serwisie egeodeta24.pl można zamawiać zarówno prenumeratę, jak i pojedynczne wydania

Zespół redakcyjny

  • Katarzyna Pakuła-Kwiecińska (redaktor naczelny)
  • Anna Wardziak (sekretarz redakcji)
  • Jerzy Przywara
  • Bożena Baranek (szefowa Działu Prenumeraty)
  • Jerzy Królikowski (redaktor prowadzący Geoforum.pl)
  • Damian Czekaj
  • Bogdan Grzechnik

Kontakt

Geodeta Sp. z o.o.
02-541 Warszawa,
ul. Narbutta 40/20
tel. (22) 849-41-63, 646-87-44
redakcja@geoforum.pl
prześlij newsa

Prenumerata
prenumerata@geoforum.pl
b.baranek@geoforum.pl
Reklama
k.kwiecinska@geoforum.pl

facebook twitter Instagram RSS