[go: up one dir, main page]

0% encontró este documento útil (0 votos)
144 vistas7 páginas

Limitaciones de Hojas de Cálculo

Este documento describe una práctica de laboratorio para demostrar las limitaciones de una hoja de cálculo para el análisis de datos. Los estudiantes descargarán un conjunto de datos sobre temperaturas de carreteras desde una página web que contiene más de 3 mil millones de registros, pero una hoja de cálculo solo puede mostrar alrededor de 1 millón de filas, dejando el 99.83% de los datos sin analizar. El documento sugiere usar herramientas alternativas como Power BI para conjuntos de datos más grandes.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
144 vistas7 páginas

Limitaciones de Hojas de Cálculo

Este documento describe una práctica de laboratorio para demostrar las limitaciones de una hoja de cálculo para el análisis de datos. Los estudiantes descargarán un conjunto de datos sobre temperaturas de carreteras desde una página web que contiene más de 3 mil millones de registros, pero una hoja de cálculo solo puede mostrar alrededor de 1 millón de filas, dejando el 99.83% de los datos sin analizar. El documento sugiere usar herramientas alternativas como Power BI para conjuntos de datos más grandes.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 7

Práctica: Demostrar las limitaciones de una hoja de cálculo

Objetivos
Observe las limitaciones de una hoja de cálculo cuando se la utiliza para el análisis de datos.
Parte 1: Estudiar y descargar los datos
Parte 2: Determinar el puente raíz

Aspectos básicos/situación
En Internet dispone de enormes cantidades de datos sin restricciones que puede descargar y utilizar para
realizar análisis. En esta práctica de laboratorio estudiará las limitaciones de las hojas de cálculo en el
análisis de datos con un conjunto de datos sin restricciones proveniente de la ciudad de Seattle.

Recursos necesarios
● Dispositivo PC con acceso a Internet de alta velocidad
● Programa de hojas de cálculo; por ejemplo: Microsoft Excel, Google Sheet, LibreOffice
Calc, Apple Numbers u OpenOffice Calc

Parte 1: Estudiar y descargar los datos


En esta parte descargará el conjunto de datos de nombre Road Weather Information Stations (Estaciones de
información climatológica vial) de https://data.seattle.gov. También estudiará algunas de las características
de este conjunto de datos.
a. Diríjase a https://data.seattle.gov/Transportation/Road-Weather-Information-Stations/egc4-d24i?.
b. Haga clic en View Data (Ver datos).
Práctica de laboratorio: Demostrar las limitaciones de una hoja de cálculo en el análisis de datos

En este conjunto de datos se indican las temperaturas de los caminos y del aire obtenidas por sensores
incrustados en puentes y en calles locales pertenecientes a la ciudad de Seattle. Los datos se actualizan
cada quince minutos.

¿Cuántos campos (columnas) hay en el conjunto de datos? ¿Cuántos registros (filas)?


_ Tiene 6 Columnas y tiene 6,051,538 Filas con 3.630.922.800 registros en total
¿Cómo se llaman los campos?
StationName; StationLocation; DateTime; RecordId; RoadSurfaceTemperature; AirTemperature;
c. Haga clic en Exportar. Haga clic en CSV para descargar este conjunto de datos en formato CSV. La
descarga demorará algunos minutos. Prosiga con la parte siguiente si no puede descargar los datos.
Nota: Si no pudo terminar de descargar el archivoRoad_Weather_Information_Stations.csv, busque
Road_Weather_Information_Stations.csv.part en su sistema. Lo más probable es que esté en su carpeta
de Descargas. Cámbiele el nombre a Road_Weather_Information_Stations.csv.

¿Qué tamaño tiene el archivo que se descargó? 520Mb _

Parte 2: Estudiar las limitaciones de una hoja de cálculo


Intentará abrir el conjunto de datos que descargó en el programa de hojas de cálculo que prefiera. Si no pudo
descargar el archivo, puede revisar los pasos y estudiar las limitaciones de las hojas de cálculo sin abrir el
archivo.
a. Abra su programa de hojas de cálculo. En este ejemplo se utiliza Microsoft Excel.
b. Importe el archivo csv que descargó: Road_Weather_Information_Stations.csv. Haga clic en
Get External Data (Obtener datos externos). Haga clic en From Text (Desde texto) y elija
Road_Weather_Information_Stations.csv.

c. Aparecerá el asistente para importar texto. En el paso 1 de 3, haga clic en Next (Siguiente) para
continuar.
d. En el paso 2 de 3, seleccione Comma (Coma) como el delimitador y desmarque Tab (Tabulación). Haga
clic en Siguiente para continuar.

e. En el paso 3 de 3, haga clic en Finish (Finalizar) para continuar.


f. Haga clic en OK (Aceptar) para importar los datos.

¿Qué mensaje de advertencia ve en la pantalla?


_ La consulta devolvió mas datos de los que se admiten en una hoja de cálculo.

¿De qué manera esta limitación le impide analizar los datos?


_ Es imposible analizar los datos con esa limitación porque no se puede analizar el 100% de la información
obtenida de la página principal.
g. Abra una hoja de cálculo nueva. Trate de alcanzar la cantidad máxima de filas de la hoja de cálculo.
¿Cuál es la cantidad máxima de filas en la hoja de cálculo que eligió?
_ 1.048.576 Filas

Compare la cantidad máxima de filas de la hoja de cálculo con la cantidad de registros presentes en el
conjunto de datos Road Weather Information Stations de https://data.seattle.gov. En función de lo que
observe, explique la limitación de la hoja de cálculo.
_Es una limitación grande porque por ejemplo la información que descargue, el 100% de los datos obtenidos
es de 3.630.922.800 y la máxima información que muestra la hoja de cálculo es de 6.051.538 lo que indica
que solo voy a analizar un 0.16% de la información y se deja de analizar el 99.83% lo que no llevaría a
presentar un análisis adecuado.
_

Reflexión
Si los programas de hojas de cálculo más usados no pueden manejar conjuntos de datos más grandes, ¿qué
herramientas de análisis de datos pueden utilizarse? Busque algunas herramientas posibles en Internet.
_ Existen varias herramientas de anlasissis de datos como Power BI, Tableau, Geckoboard, Qlik, entre las
conocidas y utilizadas esta Power Bi (Business Intelligence) herramienta flexible que permite a los usuarios
conectarse a múltiples fuentes de datos en tiempo real._

También podría gustarte