آپاچی اسپارک یک موتورِ قدرتمند، برای پردازش دادههای بزرگ به صورتِ توزیعشده است. منظور از دادههای بزرگ، داده هایی است که معمولاً بر روی یک کامپیوتر نمیتوانند پردازش شوند(مثلا دادههایی که از مقدار حافظهی اصلیِ(RAM) یک کامپیوتر بیشتر هستند). منظور از «توزیعشده» این است که، دادهها، بر روی چندین کامپیوتر(که به آنها Node یا گره گفته میشود)، قرار دارند و بایستی پردازش شوند.