Cov txheej txheem:

Dab tsi yog sau PySpark?
Dab tsi yog sau PySpark?

Video: Dab tsi yog sau PySpark?

Video: Dab tsi yog sau PySpark?
Video: yog hmoov dab tsi tub huas xyooj 2024, Kaum ib hlis
Anonim

Sau (Action) - Rov qab tag nrho cov ntsiab lus ntawm dataset raws li ib qho array ntawm qhov kev pab cuam tsav tsheb. Qhov no feem ntau muaj txiaj ntsig tom qab lub lim lossis lwm yam haujlwm uas rov qab muaj cov ntaub ntawv me me txaus.

Ua li no, PySpark yog dab tsi?

PySpark Programming. PySpark yog kev sib koom tes ntawm Apache Spark thiab Python. Apache Spark yog qhov qhib-qhov kev sib koom ua ke, tsim nyob ib puag ncig ceev, yooj yim ntawm kev siv, thiab streaming analytics whereas Python yog hom lus dav dav, qib siab programming.

Tsis tas li ntawd, daim ntawv qhia hauv PySpark yog dab tsi? Teeb Daim ntawv qhia Kev hloov pauv. A daim ntawv qhia yog ib qho kev hloov pauv hauv Apache Spark. Nws siv rau txhua lub caij ntawm RDD thiab nws rov qab qhov tshwm sim raws li RDD tshiab. Daim ntawv qhia Hloov RDD ntawm qhov ntev N mus rau lwm RDD ntawm qhov ntev N. Cov tswv yim thiab cov zis RDDs feem ntau yuav muaj tib cov ntaub ntawv.

Ua li no, SparkContext hauv PySpark yog dab tsi?

PySpark - SparkContext . Kev tshaj tawm. SparkContext yog lub ntsiab lus nkag mus rau ib qho twg spark kev ua haujlwm. Thaum peb khiav ib qho Teeb daim ntawv thov, tus tsav tsheb qhov kev pab cuam pib, uas muaj lub luag haujlwm tseem ceeb thiab koj li SparkContext tau pib ntawm no. Cov kev pab cuam tsav tsheb mam li khiav cov haujlwm hauv cov executors ntawm cov neeg ua haujlwm nodes.

Kuv yuav txheeb xyuas PySpark version li cas?

2 Teb

  1. Qhib Spark plhaub Terminal thiab nkag mus hais kom ua.
  2. sc.version Los yog spark-xa --version.
  3. Txoj hauv kev yooj yim tshaj plaws yog cia li tso tawm "spark-plhaub" hauv kab hais kom ua. Nws yuav tso saib cov.
  4. tam sim no active version ntawm Spark.

Pom zoo: