Esbrineu La Compatibilitat Per Signe Del Zodíac
Com els periodistes poden utilitzar Geocommons per crear mapes interactius
Altres
Fa uns mesos, John Keefe va escriure un Poynter.org How To sobre l'ús de shapefiles. El poder del shapefile, va escriure, és la capacitat de referir-se a regions en lloc de punts.
Però, què passa si les teves dades tenen punts (per exemple, adreces) i vols mapejar regions? Suposem, per exemple, que teniu adreces de violacions ambientals i voleu mostrar quins districtes del Congrés tenen més infraccions. Heu de trobar una manera d'associar aquests punts en formes. En aquest tutorial, explicaré com fer-ho.
Utilitzem un exemple de l'organització per a la qual treballo, la Sunlight Foundation. Tenim un lloc anomenat Dades de transparència , on els usuaris poden descarregar dades, algunes de les quals inclouen adreces. Un d'aquests conjunts de dades són les dades d'infraccions de l'EPA. Aneu a Dades de transparència, feu clic a la pestanya 'EPA' i, a continuació, cerqueu infraccions entre l'1 de juliol de 2011 i el 31 de desembre de 2011. Les dades de transparència retornaran uns 1.300 registres. Feu clic al botó gegant 'Descarregueu dades' per desar els registres al vostre ordinador.
Un cop baixem aquestes dades, les obrirem en un full de càlcul. Veureu que una de les columnes inclou l'adreça de la infracció. (Tingueu en compte que algunes de les cel·les d'aquesta columna inclouen diverses adreces, mentre que d'altres no tenen cap adreça. Per als nostres propòsits, eliminarem els registres amb diverses adreces o els sense cap adreça. Podeu consultar aquesta història anterior, 'Com els periodistes poden utilitzar Excel per organitzar les dades de les històries' si necessiteu ajuda per fer-ho.)
També hem de separar l'adreça en les seves parts components. Crearé columnes noves per a la ciutat, l'estat i el codi postal.
(Podeu consultar una de les meves instruccions anteriors: 'Com els periodistes poden utilitzar expressions regulars per fer coincidir les cadenes de text' per obtenir ajuda sobre això. Pista, la meva cerca/reemplaçament va ser cercar:
|_+_|i substituir per:
|_+_|Això deixarà alguns errors (com ara números de suite al camp de la ciutat), que solucionarem cercant:
|_+_|i substituint per:
|_+_|Amb les dades netejades, les tornarem al nostre full de càlcul. A continuació, exportarem aquest full de càlcul com a fitxer de text .csv o 'valor separat per comes' que us ofereix fitxer amb aquest aspecte .)
Ara, per agregar aquestes adreces amb els districtes del Congrés, farem servir una de les meves eines preferides: GeoCommons . Començarem aquest procés exportant el full de càlcul anterior com a fitxer de text CSV o 'valors separats per comes'. He publicat un fitxer d'exemple aquí . Aleshores, penjarem aquest CSV directament a GeoCommons.
En pujar a GeoCommons, seguirem les indicacions fins que el servei ens demani que 'ajudem a geolocalitzar' les dades. Ens donen dues opcions. En primer lloc, podem associar, o unir, les dades amb un conjunt de dades de límit. Si haguéssim de seleccionar aquesta opció, necessitaríem dades de límit al full de càlcul. Aquestes dades poden incloure noms de comtats o codis FIPS, codis de districte del Congrés, seccions censals i similars. No tenim aquests camps a les nostres dades.
La segona opció, 'geocodi basat en una adreça o nom de lloc', pren informació d'ubicació, com ara una adreça de carrer, i la converteix en longitud i latitud. Aquesta és l'opció que volem seleccionar.
Depenent de la capçalera del vostre fitxer, GeoCommons pot discernir automàticament alguns dels camps d'ubicació. En cas contrari, haurem d'ajudar GeoCommons a determinar quins camps componen l'adreça. Per fer-ho, desplaçarem cap avall fins a 'adreça d'ubicació' i seleccionarem 'editar'. Allà, triarem 'adreça del carrer'. Farem el mateix per a la ciutat, l'estat i el codi postal. A continuació, feu clic a 'Continua'. (Nota, GeoCommons només pot geocodificar fins a 5.000 adreces per fitxer.) També podeu ajustar altres tipus de dades de camp si voleu o necessiteu.
El servei trigarà una estona a descodificar les adreces i convertir-les en punts de latitud i longitud. Al final d'aquest procés, GeoCommons ens farà saber com ha estat capaç de geolocalitzar les adreces. A la meva prova, la geocodificació va trigar uns 10 minuts. (Si no voleu esperar que el vostre fitxer es geocodifiqui, no dubteu a utilitzar una còpia de les meves dades, disponible aquí .) Per descomptat, també podeu utilitzar altres serveis per geocodificar les dades en latitud i longituds, i després penjar un CSV que contingui aquests camps, a més de tots els altres, a GeoCommons.
A continuació, aprofitarem una de les millors característiques de GeoCommons: la seva capacitat per analitzar dades. Si anem al nostre conjunt de dades recentment geocodificat, podem accedir a aquestes funcions fent clic al botó 'analitzar' a la part superior dreta de la pàgina.
Això planteja un gran nombre d'opcions. Hauríeu de passar una estona jugant amb aquestes eines, però per a aquest tutorial, seleccionarem la segona, 'Agregació'. Al quadre de diàleg resultant, hem de seleccionar un conjunt de límits. Apareixerà una finestra i cercarem '111th Congressional Districts'. Allà, seleccionarem els districtes que he penjat. Aquests districtes tenen la forma de fitxers de forma, que és un mètode basat en vectors per descriure àrees.
He deseleccionat 'Mantenir els límits buits', ja que no vull mostrar els districtes que tinguin zero infraccions.
GeoCommons ara realitzarà la seva anàlisi, que en el meu cas, va trigar uns 20 minuts. Es troba el fitxer resultant aquí .
Tot i que podeu mapejar el conjunt de dades resultant dins de GeoCommons, trobo que els mapes del servei són massa limitants. Per exemple, no teniu un control total sobre com es formata la informació dels suggeriments del mapa.
Per aquest motiu, m'agrada exportar el mapa fora de GeoCommons mitjançant la funció 'Descarrega com a KML'. El fitxer KML que GeoCommons exporta conté totes les dades, així com la informació dels límits. Amb aquest fitxer, puc recórrer a Google Fusion Tables, importar el KML i tenir control total sobre el disseny, l'ombrejat, la finestra d'informació i molt més. John Keefe ja ho va explicar a la seva introducció als shapefiles, així que no cobriré el mateix terreny.
Tot i que normalment no faig servir Geocommons per al mapa acabat, és una eina inestimable per crear mapes informatius i atractius, especialment quan tractem límits o àrees.
Diverteix-te explorant i comparteix la teva experiència amb GeoCommons i el mapeig a la secció de comentaris. Si teniu altres temes que us agradaria que abordés/abordés aquesta sèrie, feu-nos-ho saber.
Aquesta història forma part d'un Poynter Hacks/Hackers sèrie que inclou Com fer que se centren en el que els periodistes poden aprendre de les tendències emergents en tecnologia i les noves eines tecnològiques.