PYSPARK DATA WRANGLING

Description :-

This is a Jupyter Notebook to demonstrate how PySpark can be used to read and write data and make transformations on health insurance claims data (diagnoses, services, procedures & rx from medical, behavioral & rx claims).

The notebook PySpark_Data_Wrangling.ipynb has the code and intermediate output. The folder memid=46 is the output of one member.

Data used :-

Claims data i.e. Consumption data of members :-
- Diagnoses (from Medical and Behavioral Claims),
- Services (from Medical and Behavioral Claims),
- Procedures (from Medical Claims),
- Pharmacy (from Pharmacy Claims)
Feature Ids

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
memid=46		memid=46
ConstantsNamespace.py		ConstantsNamespace.py
PySpark_Data_Wrangling.ipynb		PySpark_Data_Wrangling.ipynb
img.png		img.png
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

memid=46

memid=46

ConstantsNamespace.py

ConstantsNamespace.py

PySpark_Data_Wrangling.ipynb

PySpark_Data_Wrangling.ipynb

img.png

img.png

readme.md

readme.md

Repository files navigation

PYSPARK DATA WRANGLING

Description :-

Data used :-

Sample output screenshot

About

Releases

Packages

Languages

nsb700/pyspark-data-manipulation

Folders and files

Latest commit

History

Repository files navigation

PYSPARK DATA WRANGLING

Description :-

Data used :-

Sample output screenshot

About

Topics

Resources

Stars

Watchers

Forks

Languages