y solvers para sistemas lineales dispersos. - scipy.stats: distribuciones de probabilidad, pruebas estad´ ısticas (t-test, chi-cuadrado, Kolmogorov-Smirnov). - scipy.ndimage: procesamiento de im´ agenes multi- dimensional (filtros, morfolog´ ıa). Estos m´ odulos evitan que los investigadores tengan que implementar desde cero algoritmos est´ andar, lo que acelera la investigaci´ on y reduce errores. Para datos tabulares y etiquetados (similares a hojas de c´ alculo o data frames de R), la biblioteca pandas es insustituible. El objeto central es ‘DataFrame‘, una estructura bidimen- sional con columnas de tipos potencialmente diferentes, indexaci´ on por filas y columnas, y un vasto conjunto de operaciones. pandas permite: - Cargar datos desde m´ ultiples formatos (CSV, Excel, JSON, SQL, HDF5, Parquet). - Limpiar datos: manejar valores nulos (‘drop- na‘, ‘fillna‘), eliminar duplicados, convertir tipos, reemplazar valores. - Filtrar y seleccionar: mediante indexaci´ on booleana, ‘loc‘ (por etiqueta) e ‘iloc‘ (por posici´ on). - Transformar: aplicar funciones a filas/columnas, crear nuevas columnas derivadas, agrupar (‘groupby‘) con agregaciones (suma, media, mediana, conteo, etc.), combinar DataFrames (‘concat‘, ‘merge‘, ‘join‘). - Operaciones de series temporales: remuestreo, ventanas m´ oviles, desfases. - Operacio- nes estad´ ısticas: descripci´ on (‘describe‘), correlaciones, covarianzas. La sintaxis de pandas es expresiva y permite realizar operaciones complejas con pocas l´ ıneas de c´ odigo. Por ejemplo, para calcular el promedio de temperatura por ciudad y mes desde un archivo CSV, se puede escribir: 1 df = pd.read_csv(’datos.csv’) 2 promedio = df.groupby ([’ciudad ’, df[’fecha ’].dt.month ])[’temperatura ’]. mean () Esta legibilidad es clave para la reproducibilidad y la colaboraci´ on. La visualizaci´ on de datos es otro pilar. Matplotlib es la biblioteca fundamental, que provee una API similar a MATLAB para crear gr´ aficos de alta calidad. Permite gr´ aficos de l´ ıneas, dispersi´ on, barras, histogramas, contornos, superficies, im´ agenes, etc. Su integraci´ on con NumPy es directa. Aunque Matplotlib es extremadamente flexible, su API puede ser verbosa. Por ello, se han desarrollado bibliotecas de alto nivel: - **Seaborn**: basada en Matplotlib, ofrece una sintaxis m´ as simple y temas est´ eticos por defecto, adem´ as de gr´ aficos estad´ ısticos espec´ ıficos (gr´ aficos de viol´ ın, mapas de calor, pairplots, regresiones lineales con intervalos de confianza). - **Plotly**: gr´ aficos interactivos (zoom, tooltips) que se pueden incrustar en notebooks o p´ aginas web; tambi´ en permite gr´ aficos 3D, mapas y dashboards. - **Bokeh**: similar a Plotly, enfocada en grandes conjuntos de datos. - **ggplot**: una adaptaci´ on de la gram´ atica de gr´ aficos de R (aunque menos usada). - **Altair**: basada en especificaciones declarativas, muy adecuada para an´ alisis exploratorio. En el ´ ambito cient´ ıfico, los gr´ aficos generados con estas bibliotecas cumplen con los requisitos de las publicaciones (formato vectorial, etiquetas en LaTeX, personalizaci´ on de estilos). El an´ alisis de datos no se limita a tablas; abarca tambi´ en datos de alta dimensionalidad, como im´ agenes, se˜ nales de EEG, espectros, etc. Para im´ agenes, ‘scikit-image‘ ofrece algoritmos de procesamiento (filtros, segmentaci´ on, extracci´ on de caracter´ ısticas) y ‘OpenCV‘ es otra alternativa potente. Para datos geogr´ aficos, ‘GeoPandas‘ extiende pandas con geometr´ ıas, y ‘Cartopy‘ permite mapas con proyecciones. Para datos de redes (grafos), ‘NetworkX‘ Abraham Zamudio 64 PIT: Python Basico