Tengo una hoja de Excel en la que la primera columna contiene las URL y junto a cada URL hay algunas columnas. Tengo que buscar una URL específica de la primera columna y luego leer todos los datos de la columna (algunas URL tienen 2 columnas, algunas tienen 3 columnas y así sucesivamente...) para la url que se está buscando.
Hoja de Excel:
**Col1 Col2 Col3 Col4**
Row1 www.mytest1.com John Stephens 23
Row2 www.mytest2.com Ricky Martin
Row3 www.mytest3.com Rocky
def search_url_in_column1("https://www.mytest.com"):
wb = load_workbook('Test.xlsx') #Load the workbook
ws = wb['Sheet1'] #Load the worksheet
Solución del problema
Esto se puede hacer fácilmente usando pandas
. Si no tiene pandas instalado, puede instalarlo usando pip install pandas
.
import pandas as pd
df = pd.read_excel(***Excel file path***) # Storing the excel file in a variable as a dataframe
desired_data = df[df["Col1"] == "www.mytest1.com"] # Getting all rows who have the *Col1* value equal to *www.mytest1.com*.
Producción-
Col1 | Col2 | Col3 | Col4 | |
---|---|---|---|---|
0 | www.mytest1.com | John | Esteban | 23.0 |
No hay comentarios:
Publicar un comentario