Power QueryClaude DesktopStřední

Power Query — čištění špinavých dat

Cíl dne

Automaticky vyčistit typické problémy v bankovních výpisech

Cíl dne

Bankovní výpisy jsou plné špíny: PLATBA KARTOUALBERTBRNO*CZ, prázdné řádky, nejednotné formáty. Dnes to napravíš jednou provždy.

Týden 3, fáze 2: Stále pracuješ ve stejném Projectu (AI Univerzita — finanční controlling). Tvoje Custom Instructions už vědí, že jsi finanční controllerka — tvé prompty mohou jít rovnou k věci. Tvůj glosář v knowledge files dnes oceníš: Power Query má vlastní žargon (steps, applied query, M language) a Claude tě v něm provede. Pokud termín neznáš, řekni: „Vysvětli mi to s odkazem na můj glosář."

Typické problémy v CSV

  • Popis transakce: PLATBA KARTOU*ALBERT*BRNO*CZ místo Albert
  • Datum: 20240115 místo 15.01.2024
  • Prázdné řádky uprostřed dat
  • Různé oddělovače: někdy ;, někdy ,
  • Kódování: místo č vidíš \u010d

Kroky

  1. Otevři Power Query Editor (Data → Dotazy a připojení → klikni na dotaz)
  2. Prozkoumej problémy ve svých datech
  3. Vlož prompt do Claude s popisem co vidíš
  4. Proveď kroky které Claude navrhne

Vzorový prompt

V Power Query mám sloupec "Popis" s hodnotami jako:
- "PLATBA KARTOU*ALBERT*BRNO*CZ"
- "Platba kartou Albert Brno"
- "ALBERT BRNO NÁKUP 12:34"
- "Trv.příkaz: Nájem"

Potřebuji:
1. Odstranit vše za první hvězdičkou (*)
2. Převést na Title Case (první písmeno velké)
3. Odstranil bych časové razítko (formát HH:MM na konci)

Napiš kroky klikání v Power Query Editoru (ne M kód).
Pokud to nejde bez M kódu, napiš ho s komentáři.

Výstup dne

Power Query dotaz s kroky čištění. Po každém dalším importu se data vyčistí automaticky.

Co budeš mít na konci

Čistá konzistentní data jako základ pro analýzu

AI Univerzita — soukromá vzdělávací platforma