Natural Language Processing with Spark NLP. Learning to Understand Text at Scale

- Autor:
- Alex Thomas
- Promocja Przejdź


- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 366
- Dostępne formaty:
-
ePubMobi
Opis książki: Natural Language Processing with Spark NLP. Learning to Understand Text at Scale
If you want to build an enterprise-quality application that uses natural language text but aren’t sure where to begin or what tools to use, this practical guide will help get you started. Alex Thomas, principal data scientist at Wisecube, shows software engineers and data scientists how to build scalable natural language processing (NLP) applications using deep learning and the Apache Spark NLP library.
Through concrete examples, practical and theoretical explanations, and hands-on exercises for using NLP on the Spark processing framework, this book teaches you everything from basic linguistics and writing systems to sentiment analysis and search engines. You’ll also explore special concerns for developing text-based applications, such as performance.
In four sections, you’ll learn NLP basics and building blocks before diving into application and system building:
- Basics: Understand the fundamentals of natural language processing, NLP on Apache Stark, and deep learning
- Building blocks: Learn techniques for building NLP applications—including tokenization, sentence segmentation, and named-entity recognition—and discover how and why they work
- Applications: Explore the design, development, and experimentation process for building your own NLP applications
- Building NLP systems: Consider options for productionizing and deploying NLP models, including which human languages to support
Wybrane bestsellery
-
Kim jest copywriter? To osoba, która pisze teksty o określonej funkcji. Najczęściej są to treści reklamowe, wizerunkowe i pozycjonujące. Copywriterzy piszą teksty ofert handlowych i na firmowe strony internetowe, tworzą scenariusze spotów radiowych i telewizyjnych, opisują produkty i usługi oraz ...(11.90 zł najniższa cena z 30 dni)
25.93 zł
39.90 zł(-35%) -
Szkoła mówców jest napisana przez trenera, nie przez pisarza. To nie wydumane teorie, ale treści wynikające z wieloletniego doświadczenia autorki w pracy z żywym człowiekiem. Nie znajdziesz tu ogólników i łatwych rozwiązań. Dostaniesz za to mnóstwo praktycznej wiedzy i ćwiczenia, które realnie wp...
Szkoła Mówców. Myśl i prezentuj inaczej niż wszyscy Szkoła Mówców. Myśl i prezentuj inaczej niż wszyscy
(29.18 zł najniższa cena z 30 dni)26.94 zł
44.90 zł(-40%) -
Słowo „manipulacja” wywodzi się z łaciny: „mani” to „ręka”, „pulus” to „pełny”, „kontrolowany”. W efekcie „manipulacja” to działanie, w którym świadomie „trzymamy w ręce” jakiś proces. Wpływamy na kogo...
MANIPULACJA ODCZAROWANA! 777 skutecznych technik wpływu. Wydanie 2 rozszerzone MANIPULACJA ODCZAROWANA! 777 skutecznych technik wpływu. Wydanie 2 rozszerzone
(31.85 zł najniższa cena z 30 dni)31.85 zł
49.00 zł(-35%) -
Znakomita książka z dziedziny psychologii społecznej, prezentująca techniki wywierania wpływu, skierowana jest do wszystkich zainteresowanych wpływaniem na innych ludzi oraz tych, którzy pragną obronić się przed niepożądanym oddziaływaniem bądź manipulacją. Książka skierowana jest do osób, które ...(63.42 zł najniższa cena z 30 dni)
63.82 zł
79.90 zł(-20%) -
Każdego dnia tysiące z nas stają przed dylematem. Podnieść rękę? Powiedzieć coś publicznie? Zabrać głos w dyskusji, zgłosić się do referatu, zgodzić się i prezentować? Tysiące osób występują publicznie w pracy, w czasie studiów, na kongresach.
Mówca doskonały. Wystąpienia publiczne w praktyce. Wydanie 2 rozszerzone Mówca doskonały. Wystąpienia publiczne w praktyce. Wydanie 2 rozszerzone
(17.45 zł najniższa cena z 30 dni)17.45 zł
34.90 zł(-50%) -
To czwarte, uzupełnione i rozszerzone wydanie bestsellerowej książki poświęconej praktycznemu stosowaniu NLP w pracy zawodowej. Nie ma tu niezrozumiałego żargonu, za to jest klarowne wyjaśnienie koncepcji NLP w sposób gotowy do zastosowania w kontekście wpływania na ludzi, komunikacji, negocjacji...
NLP w biznesie. Techniki skutecznego przekonywania. Wydanie IV NLP w biznesie. Techniki skutecznego przekonywania. Wydanie IV
(51.35 zł najniższa cena z 30 dni)51.35 zł
79.00 zł(-35%) -
W tytule książki, która stanowi podstawę tego szkolenia, jest słowo „manipulacja”. Słowo uznane za brzydkie, choć w wielu fabrykach używa się manipulatorów, a w domu, kiedy używamy pilotów, manipulujemy sprzętem RTV. Książka, którą napisałem, miała odczarować to słowo, a w ślad za tym...
Techniki wpływu. Kurs video. Broń się przed manipulacją i skutecznie przekonuj innych Techniki wpływu. Kurs video. Broń się przed manipulacją i skutecznie przekonuj innych
(31.60 zł najniższa cena z 30 dni)39.50 zł
79.00 zł(-50%) -
Już jako nastolatek swoimi umiejętnościami zastraszył całą Amerykę. Z czasem stał się najsłynniejszym hakerem świata i wrogiem publicznym numer jeden - okrzyknięty przez media groźnym cyberprzestępcą, gorliwie ścigany przez FBI, w końcu podstępem namierzony, osaczony i spektakularnie ujęty... Uzb...
Sztuka podstępu. Łamałem ludzi, nie hasła. Wydanie II Sztuka podstępu. Łamałem ludzi, nie hasła. Wydanie II
Kevin D. Mitnick (Author), William L. Simon (Author), Steve Wozniak (Foreword)
(32.94 zł najniższa cena z 30 dni)35.69 zł
54.90 zł(-35%) -
Dobra wiadomość jest taka, że perswazji i odporności na nią można się nauczyć. Koniec z wywieraniem negatywnego wpływu na Twoje decyzje. Koniec z nieświadomym poddawaniem się manipulacji! To, że trzymasz w ręku tę książkę, oznacza, że już wykonałeś pierwszy krok. Kolejnym będzie poznanie zasad rz...
Podręcznik perswazji. Najskuteczniejsze metody przekonywania innych i świadomej ochrony przed manipulacją Podręcznik perswazji. Najskuteczniejsze metody przekonywania innych i świadomej ochrony przed manipulacją
(25.93 zł najniższa cena z 30 dni)25.93 zł
39.90 zł(-35%) -
Zdarzyło mi się kilka razy wysłuchać takiej prezentacji, że do dziś pamiętam uczucie fascynacji, narastającą ekscytację, przemykające przez moją głowę marzenia o posiadaniu proponowanego przedmiotu lub korzystaniu z oferowanej usługi. Towarzyszyło temu coraz intensywniejsze pragnienie, żeby to ...(19.95 zł najniższa cena z 30 dni)
19.95 zł
39.90 zł(-50%)
Ebooka przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video zobaczysz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP4 (pliki spakowane w ZIP)
Szczegóły książki
- ISBN Ebooka:
- 978-14-920-4771-1, 9781492047711
- Data wydania ebooka:
-
2020-06-25
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@onepress.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 4.1MB
- Rozmiar pliku Mobi:
- 9.6MB
- Kategorie:
Perswazja i NLP
Spis treści książki
- Preface
- Why Natural Language Processing Is Important and Difficult
- Background
- Philosophy
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- I. Basics
- 1. Getting Started
- Introduction
- Other Tools
- Setting Up Your Environment
- Prerequisites
- Starting Apache Spark
- Checking Out the Code
- Getting Familiar with Apache Spark
- Starting Apache Spark with Spark NLP
- Loading and Viewing Data in Apache Spark
- Hello World with Spark NLP
- 2. Natural Language Basics
- What Is Natural Language?
- Origins of Language
- Spoken Language Versus Written Language
- What Is Natural Language?
- Linguistics
- Phonetics and Phonology
- Morphology
- Syntax
- Semantics
- Sociolinguistics: Dialects, Registers, and Other Varieties
- Formality
- Context
- Pragmatics
- Roman Jakobson
- How To Use Pragmatics
- Writing Systems
- Origins
- Alphabets
- Abjads
- Abugidas
- Syllabaries
- Logographs
- Encodings
- ASCII
- Unicode
- UTF-8
- Exercises: Tokenizing
- Tokenize English
- Tokenize Greek
- Tokenize Geez (Amharic)
- Resources
- 3. NLP on Apache Spark
- Parallelism, Concurrency, Distributing Computation
- Parallelization Before Apache Hadoop
- MapReduce and Apache Hadoop
- Apache Spark
- Parallelism, Concurrency, Distributing Computation
- Architecture of Apache Spark
- Physical Architecture
- Logical Architecture
- RDDs
- Partitioning
- Serialization
- Ordering
- Output and logging
- Spark jobs
- Persisting
- Python and R
- Spark SQL and Spark MLlib
- Transformers
- SQLTransformer
- Binarizer
- VectorAssembler
- Transformers
- Estimators and Models
- MinMaxScaler
- StringIndexer
- Evaluators
- Pipelines
- Cross validation
- Serialization of models
- NLP Libraries
- Functionality Libraries
- Annotation Libraries
- NLP in Other Libraries
- Spark NLP
- Annotation Library
- Stages
- Transformers
- DocumentAssembler
- Annotators
- SentenceDetector
- Tokenizer
- Lemmatizer
- POS tagger
- Pretrained Pipelines
- Explain document ML pipeline
- Finisher
- Exercises: Build a Topic Model
- Resources
- 4. Deep Learning Basics
- Gradient Descent
- Backpropagation
- Convolutional Neural Networks
- Filters
- Pooling
- Recurrent Neural Networks
- Backpropagation Through Time
- Elman Nets
- LSTMs
- Exercise 1
- Exercise 2
- Resources
- II. Building Blocks
- 5. Processing Words
- Tokenization
- Vocabulary Reduction
- Stemming
- Lemmatization
- Stemming Versus Lemmatization
- Spelling Correction
- Normalization
- Bag-of-Words
- CountVectorizer
- N-Gram
- Visualizing: Word and Document Distributions
- Exercises
- Resources
- 6. Information Retrieval
- Inverted Indices
- Building an Inverted Index
- Step 1
- Step 2
- Step 3
- Step 4
- Building an Inverted Index
- Inverted Indices
- Vector Space Model
- Stop-Word Removal
- Inverse Document Frequency
- In Spark
- Exercises
- Resources
- 7. Classification and Regression
- Bag-of-Words Features
- Regular Expression Features
- Feature Selection
- Modeling
- Nave Bayes
- Linear Models
- Decision/Regression Trees
- Deep Learning Algorithms
- Iteration
- Exercises
- 8. Sequence Modeling with Keras
- Sentence Segmentation
- (Hidden) Markov Models
- Sentence Segmentation
- Section Segmentation
- Part-of-Speech Tagging
- Conditional Random Field
- Chunking and Syntactic Parsing
- Language Models
- Recurrent Neural Networks
- Exercise: Character N-Grams
- Exercise: Word Language Model
- Resources
- 9. Information Extraction
- Named-Entity Recognition
- Coreference Resolution
- Assertion Status Detection
- Relationship Extraction
- Summary
- Exercises
- 10. Topic Modeling
- K-Means
- Latent Semantic Indexing
- Nonnegative Matrix Factorization
- Latent Dirichlet Allocation
- Exercises
- 11. Word Embeddings
- Word2vec
- GloVe
- fastText
- Transformers
- ELMo, BERT, and XLNet
- doc2vec
- Exercises
- III. Applications
- 12. Sentiment Analysis and Emotion Detection
- Problem Statement and Constraints
- Plan the Project
- Design the Solution
- Implement the Solution
- Test and Measure the Solution
- Business Metrics
- Model-Centric Metrics
- Infrastructure Metrics
- Process Metrics
- Offline Versus Online Model Measurement
- Review
- Initial Deployment
- Fallback Plans
- Next Steps
- Conclusion
- 13. Building Knowledge Bases
- Problem Statement and Constraints
- Plan the Project
- Design the Solution
- Implement the Solution
- Test and Measure the Solution
- Business Metrics
- Model-Centric Metrics
- Infrastructure Metrics
- Process Metrics
- Review
- Conclusion
- 14. Search Engine
- Problem Statement and Constraints
- Plan the Project
- Design the Solution
- Implement the Solution
- Test and Measure the Solution
- Business Metrics
- Model-Centric Metrics
- Review
- Conclusion
- 15. Chatbot
- Problem Statement and Constraints
- Plan the Project
- Design the Solution
- Implement the Solution
- Test and Measure the Solution
- Business Metrics
- Model-Centric Metrics
- Review
- Conclusion
- 16. Object Character Recognition
- Kinds of OCR Tasks
- Images of Printed Text and PDFs to Text
- Images of Handwritten Text to Text
- Images of Text in Environment to Text
- Images of Text to Target
- Note on Different Writing Systems
- Kinds of OCR Tasks
- Problem Statement and Constraints
- Plan the Project
- Implement the Solution
- Test and Measure the Solution
- Model-Centric Metrics
- Review
- Conclusion
- IV. Building NLP Systems
- 17. Supporting Multiple Languages
- Language Typology
- Scenario: Academic Paper Classification
- Text Processing in Different Languages
- Compound Words
- Morphological Complexity
- Transfer Learning and Multilingual Deep Learning
- Search Across Languages
- Checklist
- Conclusion
- 18. Human Labeling
- Guidelines
- Scenario: Academic Paper Classification
- Inter-Labeler Agreement
- Iterative Labeling
- Labeling Text
- Classification
- Tagging
- Checklist
- Conclusion
- 19. Productionizing NLP Applications
- Spark NLP Model Cache
- Spark NLP and TensorFlow Integration
- Spark Optimization Basics
- Design-Level Optimization
- Profiling Tools
- Monitoring
- Managing Data Resources
- Testing NLP-Based Applications
- Unit Tests
- Integration Tests
- Smoke and Sanity Tests
- Performance Tests
- Usability Tests
- Demoing NLP-Based Applications
- Checklists
- Model Deployment Checklist
- Scaling and Performance Checklist
- Testing Checklist
- Conclusion
- Glossary
- Index
O'Reilly Media - inne książki
-
Digital transformation has accelerated nearly tenfold in recent years as both a business and technology journey. Yet, most white papers and how-to guides still focus solely on the business side, rather than include methods for optimizing the technology behind it. This handbook shows CIOs, IT dire...(135.15 zł najniższa cena z 30 dni)
135.15 zł
159.00 zł(-15%) -
Product management has become a critical function for modern organizations, from small startups to corporate enterprises. And yet, the day-to-day work of product management remains largely misunderstood. In theory, product managers are high-flying visionaries who build products that people love. ...(135.15 zł najniższa cena z 30 dni)
135.15 zł
159.00 zł(-15%) -
NLP has exploded in popularity over the last few years. But while Google, Facebook, OpenAI, and others continue to release larger language models, many teams still struggle with building NLP applications that live up to the hype. This hands-on guide helps you get up to speed on the latest and mos...
Applied Natural Language Processing in the Enterprise Applied Natural Language Processing in the Enterprise
(245.65 zł najniższa cena z 30 dni)254.15 zł
299.00 zł(-15%) -
Most of the high-profile cases of real or perceived unethical activity in data science aren’t matters of bad intent. Rather, they occur because the ethics simply aren’t thought through well enough. Being ethical takes constant diligence, and in many situations identifying the right ch...
97 Things About Ethics Everyone in Data Science Should Know 97 Things About Ethics Everyone in Data Science Should Know
(152.15 zł najniższa cena z 30 dni)152.15 zł
179.00 zł(-15%) -
Many books and courses tackle natural language processing (NLP) problems with toy use cases and well-defined datasets. But if you want to build, iterate, and scale NLP systems in a business setting and tailor them for particular industry verticals, this is your guide. Software engineers and data ...
Practical Natural Language Processing. A Comprehensive Guide to Building Real-World NLP Systems Practical Natural Language Processing. A Comprehensive Guide to Building Real-World NLP Systems
(237.15 zł najniższa cena z 30 dni)237.15 zł
279.00 zł(-15%) -
Your team will change whether you like it or not. People will come and go. Your company might double in size or even be acquired. In this practical book, author Heidi Helfand shares techniques for reteaming effectively. Engineering leaders will learn how to catalyze team change to reduce the risk...
Dynamic Reteaming. The Art and Wisdom of Changing Teams. 2nd Edition Dynamic Reteaming. The Art and Wisdom of Changing Teams. 2nd Edition
(152.15 zł najniższa cena z 30 dni)152.15 zł
179.00 zł(-15%) -
Many people think leadership is a higher calling that resides exclusively with a select few who practice and preach big, complex leadership philosophies. But as this practical book reveals, what’s most important for leadership is principled consistency. Time and again, small things done wel...(135.15 zł najniższa cena z 30 dni)
135.15 zł
159.00 zł(-15%) -
If you’re striving to make products and services that your customers will love, then you’ll need a customer-driven organization. As companies transform their businesses to meet the demands of the digital age, they find themselves grappling with uniquely human challenges. Organizationa...
The Customer-Driven Culture: A Microsoft Story. Six Proven Strategies to Hack Your Culture and Develop a Learning-Focused Organization The Customer-Driven Culture: A Microsoft Story. Six Proven Strategies to Hack Your Culture and Develop a Learning-Focused Organization
(169.15 zł najniższa cena z 30 dni)169.15 zł
199.00 zł(-15%) -
Companies from startups to corporate giants face massive amounts of disruption today. Now more than ever, organizations need nimble and responsive leaders who know how to exploit the opportunities that change brings. In this insightful book, Jean Dahl, a senior executive and expert in the Lean mi...
Leading Lean. Ensuring Success and Developing a Framework for Leadership Leading Lean. Ensuring Success and Developing a Framework for Leadership
(135.15 zł najniższa cena z 30 dni)135.15 zł
159.00 zł(-15%) -
Is your organization prepared for the next paradigm of customer experience, or will you be left behind? This practical book will make you a winner in a market driven by experience, enabling you to develop desirable offerings and standout service to attract loyal customers.Author Simon Clatworthy ...
The Experience-Centric Organization. How to Win Through Customer Experience The Experience-Centric Organization. How to Win Through Customer Experience
(169.15 zł najniższa cena z 30 dni)169.15 zł
199.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
W przypadku usługi "Druk na żądanie" termin dostarczenia przesyłki może obejmować także czas potrzebny na dodruk (do 10 dni roboczych)
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.


Oceny i opinie klientów: Natural Language Processing with Spark NLP. Learning to Understand Text at Scale Alex Thomas (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.