ساخت جرقه پرواز: NVIDIA شتاب جهان محبوب ترین تجزیه و تحلیل داده های پلت فرم

محبوب ترین در جهان تجزیه و تحلیل داده های نرم افزار آپاچی جرقه در حال حاضر ارائه می دهد انقلابی شتاب GPU به آن بیش از نیم میلیون کاربر از طریق در دسترس عمومی انتشار جرقه 3.0.

Databricks فراهم می کند پیشرو مبتنی بر ابر شرکت جرقه پلت فرم اجرا بر روی بیش از یک میلیون ماشین های مجازی در هر روز است. در جرقه + AI نشست امروز Databricks اعلام کرد که Databricks Runtime 7.0 برای یادگیری ماشین ویژگی های GPU-شتاب دهنده آگاه برنامه ریزی با جرقه 3.0 توسعه یافته در همکاری با انویدیا و دیگر اعضای جامعه.

ابر گوگل به تازگی اعلام کرد در دسترس بودن یک جرقه 3.0 پیش نمایش در Dataproc تصویر نسخه 2.0 با اشاره قدرتمند NVIDIA GPU شتاب که در حال حاضر ممکن است با تشکر از همکاری جامعه منبع باز. ما خواهید بود با میزبانی یک وبینار با Google Cloud در جولای 16 به شیرجه رفتن به این قابلیت های جدید هیجان انگیز برای دانشمندان داده.

در ضمن منبع باز جدید رپیدز شتاب دهنده برای Apache Spark در حال حاضر در دسترس برای سرعت بخشیدن به ETL (استخراج, تبدیل بار) و انتقال داده ها به افزایش تجزیه و تحلیل عملکرد از پایان دادن به پایان بدون هیچ گونه تغییر کد.

عملکرد سریع تر در جرقه نه تنها سریعتر به معنی بینش, اما همچنین کاهش هزینه های پس از شرکت می تواند تکمیل وظایف سنگین با استفاده از زیرساخت های کمتر.

شتاب تجزیه و تحلیل داده های علمی محاسبات حس می کند از هوش مصنوعی

جرقه به طور فزاینده ای در اخبار برای دلیل خوب است.

اطلاعات ضروری برای کمک به سازمان ها حرکت تغییر فرصت ها و تهدیدات احتمالی. اما برای این کار آنها نیاز به کشف مهم سرنخ های پنهان در داده های خود را.

سازمان اضافه کردن به انبوه اطلاعات در هر زمانی که یک مشتری با کلیک بر روی یک وب سایت میزبان یک تماس با پشتیبانی از مشتری و یا تولید روزانه گزارش فروش. با افزایش هوش مصنوعی و تجزیه و تحلیل داده های مهم تبدیل شده برای کمک به شرکت ها به نقطه روند و اقامت جلوتر از بازارهای در حال تغییر.

تا زمانی که به تازگی تجزیه و تحلیل داده های متکی است کوچک می دهد به اینسو انسو جمع کردن داده های تاریخی و بینش. این دادهها از طریق ETL در بسیار ساختار داده های ذخیره شده در داده های سنتی در انبارها.

ETL اغلب تبدیل به یک تنگنا برای اطلاعات دانشمندان در حال کار بر روی هوش مصنوعی-بر اساس پیش بینی ها و توصیه ها. تخمین زده می شود را تا 70-90 درصد از داده دانشمند زمان ETL را کند می کند کردن گردش کار و روابط پس از استعداد ترین دنیوی بخشی از کار خود را.

هنگامی که یک دانشمند داده است انتظار برای ETL آنها بازآموزی مدل های خود را برای به دست آوردن بهتر هوش کسب و کار. سنتی CPU زیرساخت نمی تواند مقیاس کارآمد به جای این حجم کار که اغلب باعث می شود هزینه ها به بادکنک.

با GPU-accelerated جرقه ETL دیگر مشکل جادوها. صنایع از جمله بهداشت و درمان, سرگرمی, انرژی, سرمایه گذاری خرده فروشی و بسیاری دیگر هم اکنون می توانید هزینه به طور موثر در سرعت بخشیدن به داده های خود را تجزیه و تحلیل بینش.

قدرت پردازش موازی برای تجزیه و تحلیل داده های

GPU پردازش موازی اجازه می دهد تا کامپیوتر به کار در عملیات های متعدد در یک زمان. در یک مرکز داده این قابلیت مقیاس کردن انبوه به پشتیبانی پیچیده تجزیه و تحلیل داده های پروژه ها. با بیشتر سازمان ها اعمال نفوذ هوش مصنوعی و یادگیری ماشین ابزار پردازش موازی تبدیل به بحرانی برای تسریع داده ها-تجزیه و تحلیل ترافیک سنگین و ETL خطوط لوله است که رانندگی با این حجم کار.

در نظر بگیرید یک خرده فروش به دنبال پیش بینی آنچه به سهام برای فصل آینده است. این امر نیاز به بررسی های اخیر خرید و فروش و همچنین سال گذشته داده است. زرنگ و دانا دانشمند داده ممکن است اضافه کردن مدل آب و هوا به این تجزیه و تحلیل برای دیدن آنچه که تاثیر یک مرطوب یا خشک فصل را در نتایج. آنها همچنین ممکن است ادغام تمایلات تجزیه و تحلیل داده ها برای ارزیابی روند چه هستند محبوب ترین فیلم این سال است.

با بسیاری از منابع داده ها برای تجزیه و تحلیل سرعت بحرانی برای مدلسازی تاثیر متغیرهای مختلف ممکن است در فروش. این است که در آن تجزیه و تحلیل حرکت به یادگیری ماشین و جایی که gpu ها ضروری تبدیل شده است.

رپیدز شتاب دهنده Supercharges Apache Spark 3.0

به عنوان اطلاعات دانشمندان از تغییر های سنتی با استفاده از تجزیه و تحلیل به هوش مصنوعی برنامه های کاربردی که بهتر از مدل های پیچیده خواسته های بازار پردازنده های مبتنی بر پردازش نمی تواند نگه دارید تا بدون به خطر انداختن یا با سرعت و یا هزینه. رشد تصویب هوش مصنوعی در تجزیه و تحلیل ترافیک ایجاد کرده نیاز به یک چارچوب جدید برای پردازش داده ها به سرعت و بدون هزینه و کارآمد با gpu ها.

جدید رپیدز شتاب دهنده برای Apache Spark متصل جرقه محاسبات توزیع شده در چارچوب قدرتمند رپیدز cuDF کتابخانه برای فعال کردن شتاب GPU از جرقه DataFrame و جرقه SQL عملیات. رپیدز شتاب دهنده نیز سرعت جرقه زدن عملیات با پیدا کردن سریعترین راه برای انتقال داده ها بین جرقه گره.

بازدید از GitHub صفحه برای دسترسی رپیدز شتاب دهنده برای Apache Spark.

سازمان دیده بان جرقه 3.0 با حداکثر سرعت دویدن در gpu ها در این ویدئو نسخه ی نمایشی: https://www.youtube.com/watch?v=tGqEZYUqexY&feature=emb_logo

برای کسب اطلاعات بیشتر در مورد جرقه 3.0 آزادی, بازدید از بنیاد نرمافزار آپاچی.

اطلاعات دانشمندان می توانید اطلاعات بیشتر در مورد جرقه 3.0 در رایگان ما جرقه 3.0 e-book.

توسط Erik پوند

tinyurlis.gdu.nuclck.ruulvis.netshrtco.de