Verwandte Artikel zu Spark: Big Data Cluster Computing in Production

Spark: Big Data Cluster Computing in Production - Softcover

 
9781119254010: Spark: Big Data Cluster Computing in Production

Inhaltsangabe

Production-targeted Spark guidance with real-world use cases

Spark: Big Data Cluster Computing in Production goes beyond general Spark overviews to provide targeted guidance toward using lightning-fast big-data clustering in production. Written by an expert team well-known in the big data community, this book walks you through the challenges in moving from proof-of-concept or demo Spark applications to live Spark in production. Real use cases provide deep insight into common problems, limitations, challenges, and opportunities, while expert tips and tricks help you get the most out of Spark performance. Coverage includes Spark SQL, Tachyon, Kerberos, ML Lib, YARN, and Mesos, with clear, actionable guidance on resource scheduling, db connectors, streaming, security, and much more.

Spark has become the tool of choice for many Big Data problems, with more active contributors than any other Apache Software project. General introductory books abound, but this book is the first to provide deep insight and real-world advice on using Spark in production. Specific guidance, expert tips, and invaluable foresight make this guide an incredibly useful resource for real production settings.

  • Review Spark hardware requirements and estimate cluster size
  • Gain insight from real-world production use cases
  • Tighten security, schedule resources, and fine-tune performance
  • Overcome common problems encountered using Spark in production

Spark works with other big data tools including MapReduce and Hadoop, and uses languages you already know like Java, Scala, Python, and R. Lightning speed makes Spark too good to pass up, but understanding limitations and challenges in advance goes a long way toward easing actual production implementation. Spark: Big Data Cluster Computing in Production tells you everything you need to know, with real-world production insight and expert guidance, tips, and tricks.

Die Inhaltsangabe kann sich auf eine andere Ausgabe dieses Titels beziehen.

Über die Autorin bzw. den Autor

Ilya Ganelin is a data engineer working at Capital One Data Innovation Lab. Ilya is an active contributor to the core components of Apache Spark and a committer to Apache Apex.

Ema Orhian is a Big Data Engineer interested in scaling algorithms. She is the main committer on jaws-spark-sql-rest, a data warehouse explorer on top of Spark SQL.

Kai Sasaki is a software engineer working in distributed computing and machine learning. He is a Spark contributor who develops mainly MLlib, ML libraries.

Brennon York has been a core contributor to Apache Spark since 2014 including development on GraphX and the core build environment.

Von der hinteren Coverseite

TIPS, TRICKS, AND SOLUTIONS FOR USING SPARK IN PRODUCTION

Spark's popularity means the field is expanding--in terms of both use and capability. Faster than Hadoop and MapReduce, but compatible with Java(R), Scala, Python(R), and R, this open source clustering framework is becoming a must-have skill. Spark: Big Data Cluster Computing in Production goes beyond the basics to show you how to bring Spark to real-world production environments. With expert instruction, real-life use cases, and frank discussion, this guide helps you move past the challenges and bring proof-of-concept Spark applications live.

  • Fine-tune your Spark app to run on production data
  • Manage resources, organize storage, and master monitoring
  • Learn about potential problems from real-world use cases, and see where Spark fits best
  • Estimate cluster size and nail down hardware requirements
  • Tune up performance with memory management, partitioning, shuffling, and more
  • Ensure data security with Kerberos
  • Head off Spark streaming problems in production
  • Integrate Spark with Yarn, Mesos, Tachyon, and more

„Über diesen Titel“ kann sich auf eine andere Ausgabe dieses Titels beziehen.

Gebraucht kaufen

Zustand: Gut
May have limited writing in cover...
Diesen Artikel anzeigen

EUR 5,76 für den Versand von USA nach Deutschland

Versandziele, Kosten & Dauer

Gratis für den Versand innerhalb von/der Deutschland

Versandziele, Kosten & Dauer

Weitere beliebte Ausgaben desselben Titels

9788126562480: Spark: Big Data Cluster Computing in Production

Vorgestellte Ausgabe

ISBN 10:  812656248X ISBN 13:  9788126562480
Verlag: Wiley india Pvt. Ltd
Softcover

Suchergebnisse für Spark: Big Data Cluster Computing in Production

Beispielbild für diese ISBN

Ganelin, Ilya; Orhian, Ema; Sasaki, Kai
Verlag: Wiley, 2016
ISBN 10: 1119254019 ISBN 13: 9781119254010
Gebraucht Paperback

Anbieter: ThriftBooks-Dallas, Dallas, TX, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Paperback. Zustand: Very Good. No Jacket. May have limited writing in cover pages. Pages are unmarked. ~ ThriftBooks: Read More, Spend Less 0.9. Artikel-Nr. G1119254019I4N00

Verkäufer kontaktieren

Gebraucht kaufen

EUR 14,11
Währung umrechnen
Versand: EUR 5,76
Von USA nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: 1 verfügbar

In den Warenkorb

Foto des Verkäufers

I Ganelin
Verlag: John Wiley & Sons, 2016
ISBN 10: 1119254019 ISBN 13: 9781119254010
Neu Softcover

Anbieter: moluna, Greven, Deutschland

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. Ilya Ganelin is a data engineer working at Capital One Data Innovation Lab. Ilya is an active contributor to the core components of Apache Spark and a committer to Apache Apex.Ema Orhian is a Big Data Engineer interested in scaling algorithms. She is the ma. Artikel-Nr. 121523897

Verkäufer kontaktieren

Neu kaufen

EUR 49,98
Währung umrechnen
Versand: Gratis
Innerhalb Deutschlands
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Brennon York
Verlag: John Wiley and Sons Inc, 2016
ISBN 10: 1119254019 ISBN 13: 9781119254010
Neu PAP

Anbieter: PBShop.store UK, Fairford, GLOS, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

PAP. Zustand: New. New Book. Shipped from UK. Established seller since 2000. Artikel-Nr. FW-9781119254010

Verkäufer kontaktieren

Neu kaufen

EUR 47,99
Währung umrechnen
Versand: EUR 4,50
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: 15 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Ganelin, Ilya; Orhian, Ema; Sasaki, Kai; York, Brennon
Verlag: Wiley, 2016
ISBN 10: 1119254019 ISBN 13: 9781119254010
Neu Softcover

Anbieter: Ria Christie Collections, Uxbridge, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. In. Artikel-Nr. ria9781119254010_new

Verkäufer kontaktieren

Neu kaufen

EUR 52,06
Währung umrechnen
Versand: EUR 5,78
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: 15 verfügbar

In den Warenkorb

Foto des Verkäufers

Ilya Ganelin
Verlag: Wiley Mär 2016, 2016
ISBN 10: 1119254019 ISBN 13: 9781119254010
Neu Taschenbuch

Anbieter: AHA-BUCH GmbH, Einbeck, Deutschland

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Taschenbuch. Zustand: Neu. Neuware - Production-targeted Spark guidance with real-world use casesSpark: Big Data Cluster Computing in Production goes beyond general Spark overviews to provide targeted guidance toward using lightning-fast big-data clustering in production. Written by an expert team well-known in the big data community, this book walks you through the challenges in moving from proof-of-concept or demo Spark applications to live Spark in production. Real use cases provide deep insight into common problems, limitations, challenges, and opportunities, while expert tips and tricks help you get the most out of Spark performance. Coverage includes Spark SQL, Tachyon, Kerberos, ML Lib, YARN, and Mesos, with clear, actionable guidance on resource scheduling, db connectors, streaming, security, and much more.Spark has become the tool of choice for many Big Data problems, with more active contributors than any other Apache Software project. General introductory books abound, but this book is the first to provide deep insight and real-world advice on using Spark in production. Specific guidance, expert tips, and invaluable foresight make this guide an incredibly useful resource for real production settings.\* Review Spark hardware requirements and estimate cluster size\* Gain insight from real-world production use cases\* Tighten security, schedule resources, and fine-tune performance\* Overcome common problems encountered using Spark in productionSpark works with other big data tools including MapReduce and Hadoop, and uses languages you already know like Java, Scala, Python, and R. Lightning speed makes Spark too good to pass up, but understanding limitations and challenges in advance goes a long way toward easing actual production implementation. Spark: Big Data Cluster Computing in Production tells you everything you need to know, with real-world production insight and expert guidance, tips, and tricks. Artikel-Nr. 9781119254010

Verkäufer kontaktieren

Neu kaufen

EUR 60,37
Währung umrechnen
Versand: Gratis
Innerhalb Deutschlands
Versandziele, Kosten & Dauer

Anzahl: 2 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Ganelin, Ilya; Orhian, Ema; Sasaki, Kai; York, Brennon
Verlag: Wiley, 2016
ISBN 10: 1119254019 ISBN 13: 9781119254010
Neu Softcover

Anbieter: Majestic Books, Hounslow, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. pp. 260. Artikel-Nr. 373909551

Verkäufer kontaktieren

Neu kaufen

EUR 52,26
Währung umrechnen
Versand: EUR 10,27
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: 3 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Ganelin, Ilya/ Orhian, Ema/ Sasaki, Kai/ York, Brennon
Verlag: John Wiley & Sons Inc, 2016
ISBN 10: 1119254019 ISBN 13: 9781119254010
Neu Paperback

Anbieter: Revaluation Books, Exeter, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Paperback. Zustand: Brand New. 1st edition. 216 pages. 9.13x7.32x0.71 inches. In Stock. Artikel-Nr. __1119254019

Verkäufer kontaktieren

Neu kaufen

EUR 56,33
Währung umrechnen
Versand: EUR 11,61
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: 2 verfügbar

In den Warenkorb