Google Data Analytics Certificate – Contents Review (Course 1 – Foundations: Data, Data, Everywhere)

Bài viết này mình chia sẻ các bạn những kiến thức người học có thể nắm được sau khi hoàn thành khoá học phân tích dữ liệu của Google – Google Data Analytics.
Các bạn có thể tham gia học và lấy chứng chỉ tại Coursera.

Để đạt được chứng chỉ Google Data Analytics, người học phải hoàn thành 8 khoá học thành phần với thời gian ước tính trong vòng 6 tháng (tất nhiên là các bạn có thể rút ngắn thời gian học). Mình sẽ đi chi tiết nội dung của từng khoá ngay bên dưới.

Vì khối lượng kiến thức của chứng chỉ khá nhiều nên mình chia nội dung thành 8 bài viết tương ứng với 8 khóa học để mọi người dễ theo dõi.


Table of Contents

Course 1 – Foundations: Data, Data, Everywhere
Week 1 – Introducing data anlytics
Week 2 – All about analytical thinking
Week 3 – The wonderful world of data
Week 4 – Set up your toolbox


Course 1 – Foundations: Data, Data, Everywhere

Week 1 – Introducing data anlytics

Transfroming data into insights
Chuyển đổi dữ liệu sang thông tin cần thiết

Cho một tình huống thực tế như sau: Có rất nhiều nhân viên đã nghỉ việc trong năm đầu tiên. Là một chuyên viên phân tích (CVPT), bạn sử dụng quá trình phân tích như thế nào để trả lời cho câu hỏi: làm sao để tổ chức có thể nâng cao tỷ lệ giữ chân nhân sự, đặc biệt là những người làm dưới một năm?

Có 6 bước trong quá trình phân tích dữ liệu:
ask ➔ prepare ➔ process ➔ analyze ➔ share ➔ act

Bước 1: Ask – Đặt câu hỏi
CVPT dữ liệu cần xác định được “dự án sẽ trông như thế nào“, “làm như thế nào để đạt kết quả“. Để định rõ được những điều này, CVPT nên đưa ra những câu hỏi, làm việc kết hợp, giải đáp những câu hỏi cùng với trưởng nhóm và quản lý – những người có liên quan đến dự án. Một số câu hỏi có thể là:

  • What do you think new employees need to learn to be successful in their first year on the job?
    Anh/chị cho rằng, nhân sự cần học những gì để trở nên thành công trong năm đầu sự nghiệp của họ?
  • Have you gathered data from new employees before? If so, may we have access to the historical data?
    Anh/chị đã thu thập được dữ liệu từ những nhân sự trước đây chưa? Nếu có, tôi (CVPT) có thể truy cập nó được không?
  • Do you believe managers with higher retention rates offer new employees something extra or unique?
    Anh/chị có tin rằng, những người quản lý với năng lực giữ chân nhân sự tốt đưa cho nhân sự mới những việc phụ thêm hoặc những việc chỉ dành riêng cho họ?
  • What do you suspect is a leading cause of dissatisfaction among new employees?
    Anh/chị có nghi ngờ rằng, khả năng lãnh đạo gây ra sự bất mãn trong nhân viên?
  • By what percentage would you like employee retention to increase in the next fiscal year?
    Anh/chị mong muốn tỷ lệ giữ chân nhân sự sẽ tăng bao nhiêu phần trăm trong năm tài khóa tiếp theo?

Bước 2: Prepare – Chuẩn bị
Mọi việc đều bắt đầu với sự chuẩn bị kỹ lưỡng. Nhóm dự án xây dựng khung thời gian kéo dài trong ba tháng và quyết định rằng họ muốn truyền đạt lại quá trình này như thế nào đến các bên liên quan. Trong bước này, CVPT nhận diện mình cần dữ liệu gì để đạt được kết quả mà mình đã xác định trong bước liền trước. Một số việc mà CVPT nên chuẩn bị:

  • They developed specific questions to ask about employee satisfaction with different business processes, such as hiring and onboarding, and their overall compensation.
    CVPT xây dựng bộ câu hỏi cụ thể để tìm hiểu về mức độ hài lòng của nhân sự về các vấn đề liên quan đến công ty như: tuyển dụng, đào tạo thử việc và tất cả những khoản phúc lợi cho nhân viên,…
  • They established rules for who would have access to the data collected – in this case, anyone outside the group wouldn’t have access to the raw data, but could view summarized or aggregated data. For example, an individual’s compensation wouldn’t be available, but salary ranges for groups of individuals would be viewable.
    CVPT thiết lập một số quy định cho những người muốn truy cập vào dữ liệu về nhân sự mà mình thu thập được – trong trường hợp này, bất kỳ ai không thuộc dự án đều không thể truy cập dữ liệu thô, chỉ có thể xem dữ liệu đã qua xử lý. Ví dụ, số liệu về khoản tiền bù đắp của một nhân viên sẽ bị ẩn đi, nhưng khoảng lương vẫn có thể xem được.
  • They finalized what specific information would be gathered, and how best to present the data visually. The analysts brainstormed possible project- and data-related issues and how to avoid them.
    CVPT tổng hợp những thông tin đã thu thập được, và xem xét trình bày dữ liệu này như thế nào là tốt nhất. CVPT cũng nên lường trước những vấn đề có thể xảy ra liên quan đến dự án nói chung và dữ liệu nói riêng để tìm cách tránh được chúng.

Bước 3: Process – Xử lý
Nhóm dự án đã tiến hành gửi đi khảo sát. Một CVPT giỏi là người biết cách tôn trọng dữ liệu và tôn trọng những người đã cung cấp thông tin trong phiếu khảo sát. Vì nhân sự cần cung cấp thông tin cá nhân, nên việc đảm bảo tất cả nhân sự sẵn lòng tham gia khảo sát là rất quan trọng. CVPT dữ liệu cũng cần phải chắc chắn rằng nhân sự biết được thông tin cá nhân của họ sẽ được thu thập, lưu trữ, quản lý và bảo vệ. Việc thu thập và sử dụng thông tin hợp đạo đức là một trong số những trách nhiệm quan trọng của một CVPT dữ liệu. Để duy trì độ bảo mật, bảo vệ và lưu trữ dữ liệu hiệu quả, có một số bước sau đây mà một CVPT cần thực hiện:

  • They restricted access to the data to a limited number of analysts.
    CVPT hạn chế số lượng thành viên có quyền truy cập vào dữ liệu.
  • They cleaned the data to make sure it was complete, correct, and relevant. Certain data was aggregated and summarized without revealing individual responses.
    CVPT làm sạch dữ liệu để đảm bảo dữ liệu toàn vẹn, đúng và có liên quan. Một số dữ liệu được tổng hợp mà không cần tiết lộ các phản hồi của cá nhân.
  • They uploaded raw data to an internal data warehouse for an additional layer of security.
    CVPT đưa dữ liệu thô vào bộ nhớ lưu trữ cùng với việc cài đặt lớp bảo mật tăng cường.

Bước 4: Analyze – Phân tích
Sau đó, CVPT làm những việc mà họ có thể làm tốt nhất, đó là: phân tích. Từ khảo sát thu thập được, CVPT dữ liệu khám phá ra rằng trải nghiệm của một nhân sự với một số quá trình nào đó là điểm mấu chốt trong mức độ hài lòng tổng quan của họ. Một số thông tin CVPT tìm được:

  • Employees who experienced a long and complicated hiring process were most likely to leave the company.
    Những nhân sự trải qua quá trình tuyển dụng dài và phức tạp là đối tượng dễ rời công ty nhất.
  • Employees who experienced an efficient and transparent evaluation and feedback process were most likely to remain with the company.
    Những nhân sự trải qua quá trình phản hồi, đánh giá minh bạch và hiệu quả là đối tượng có khả năng ở lại công ty lâu hơn.

Nhóm dự án biết rằng rất quan trọng để ghi lại thông tin một cách chính xác về những kết luận họ rút ra được từ một số nghiên cứu. Về mặt khác, điều này lại làm giảm đi niềm tin trong việc xử lý khảo sát và giảm đi khả năng thu thập thông tin đúng sự thật từ nhân sự trong các cuộc khảo sát sắp tới.

Bước 5: Share – Chia sẻ
Bên cạnh việc đảm bảo rằng dữ liệu đã được bảo vệ và lưu trữ an toàn, CVPT cũng nên cẩn thận trong việc chia sẻ các báo cáo. Một số lưu ý:

  • They shared the report with managers who met or exceeded the minimum number of direct reports with submitted responses to the survey.
    CVPT chia sẻ báo cáo với các cấp quản lý đáp ứng hoặc vượt quá số lượng tối thiểu của các báo cáo trực tiếp có các câu trả lời đã được gửi cho cuộc khảo sát
  • They presented the results to the managers to make sure they had the full picture.
    CVPT trình bày kết quả với các quản lý để đảm bảo rằng quản lý có cái nhìn về bức tranh toàn cảnh.
  • They asked the managers to personally deliver the results to their teams.
    CVPT yêu cầu cấp quản lý đích thân gửi đi kết quả báo cáo cho nhóm của họ.

Quá trình này cho các nhà quản lý cơ hội để làm việc với kết quả trong bối cảnh thích hợp. Từ đó họ có thể tiến hành các cuộc thảo luận hiệu quả về các bước tiếp theo để nâng cao mức độ gắn bó của nhân sự.

Bước 6: Act – Hành động
Bước cuối cùng của quá trình là đội ngũ CVPT sẽ làm việc với các cấp quản lý để quyết định tiến hành thay đổi và hành động như thế nào là tốt nhất dựa trên thông tin tìm được. Một số đề xuất của bước này:

  • Standardize the hiring and evaluation process for employees based on the most efficient and transparent practices.
    Tiêu chuẩn hóa quá trình đánh giá và tuyển dụng nhân sự dựa vào hoàn cảnh minh bạch và hiệu quả nhất.
  • Conduct the same survey annually and compare results with those from the previous year.
    Thực hiện khảo sát tương tự hằng năm và so sánh kết quả với các khảo sát ở những năm trước.

Một năm sau, khảo sát tương tự cũng được gửi tới nhân sự. CVPT đoán trước rằng việc so sánh giữa hai kết quả sẽ cho thấy được kế hoạch đã thực hiện như thế nào. Sau cùng, việc thay đổi quy trình đã nâng cao được tỷ lệ giữ chân nhân sự và những gì mà đội ngũ lãnh đạo thực hiện đã rất thành công.

Data ecosystem
Hệ sinh thái dữ liệu

What is the ecosystem?
Hệ sinh thái dữ liệu là gì?

  • An ecosystem is a group of elements that interact to produce, manage, store, organize, analyze, and share data.
    Hệ sinh thái là một tập hợp các thành tố tương tác với nhau để tạo ra, quản lý, lưu trữ, tổ chức, phân tích và chia sẻ dữ liệu.
  • For example, you could tap into your retail store’s database, which is filled with customer names, addresses, previous purchases, and customer reviews. You could use this information to predict what these customers will buy in the future.
    Ví dụ, bạn có thể truy cập vào hệ cơ sở dữ liệu chứa tên khách hàng, địa chỉ, lần mua hàng gần nhất và các đánh giá của họ. Bạn có thể sử dụng những thông tin đó để dự đoán khách hàng sẽ mua gì trong tương lai.

How data informs better decisions
Dữ cung cấp các quyết định tốt hơn như thế nào

  • Data-driven decision making is defined as using facts to guide business strategy.
    Quá trình đưa ra quyết định dựa trên dữ liệu được định nghĩa là cách sử dụng số liệu thực tế để dẫn dắt các chiến dịch kinh doanh.
  • Organizations in various industries are constantly empowered to make better, data-driven decisions through data analysts.
    Các tổ chức trong nhiều ngành công nghiệp liên tục được chỉ dẫn để đưa ra các quyết định tốt hơn dựa trên số liệu thông qua các CVPT dữ liệu.
  • A data analyst finds data, analyzes it, and uses it to uncover trends, patterns, and relationships.
    Một CVPT tìm được dữ liệu, phân tích nó và sử dụng nó để phát hiện ra xu hướng, mô hình và các mối quan hệ giữa số liệu.
  • Sometimes the data-driven strategy will build on what has worked in the past.
    Thỉnh thoảng các chiến lược dựa trên dữ liệu sẽ xây dựng trên những gì chúng đã làm trong quá khứ.
  • Other times, it can guide a business to branch out in a whole new direction.
    Cũng có lúc, dữ liệu có thể dẫn dắt doanh nghiệp mở rộng kinh doanh theo một hướng mới.
  • Data-driven decision making can be so powerful that it can make entire business methods obsolete.
    Việc đưa ra quyết định dựa trên dữ liệu là một phương pháp khá mạnh vì nó có thể làm cho các phương pháp kinh doanh trước đây trở nên lỗi thời.
  • Data analysts play a critical role in ensuring that data are built into every business strategy.
    CVPT đóng vai trò quan trọng trong việc đảm bảo rằng dữ liệu được tạo dựng lên từ mỗi chiến lược kinh doanh.
  • Data alone will never be as powerful as data combined with human experience, observation, and intuition.
    Dữ liệu chỉ có sức mạnh khi nó kết hợp với kinh nghiệm, khả năng quan sát và trực giác của con người.

Data and gut instinct
Dữ liệu và linh cảm

Gut instinct là một cảm nghĩ trực giác về một điều gì đó không thể hoặc rất khó để giải thích được. Cảm giác này không đồng nghĩa với điều gì đó không rõ ràng; chúng ta tiếp nhận được tín hiệu nhưng không hề nhận ra điều đó. Bạn chỉ biết có cảm giác là “nó đúng” vậy thôi nhưng không giải thích được.

Origins of the data analysis process
Một số phiên bản gốc của quá trình phân tích dữ liệu

(1) EMC’s data analysis life cycle
1. Discovery
2. Pre-processing data
3. Model planning
4. Model building
5. Communicate results
6. Operationalize

(2) SAS’s iterative life cycle
1. Ask
2. Prepare
3. Explore
4. Model
5. Implement
6. Act
7. Evaluate

(3) Project-based data analytics life cycle
1. Identifying the problem
2. Designing data requirements
3. Pre-processing data
4. Performing data analysis
5. Visualizing data

(4) Big data analytics life cycle
1. Business case evaluation
2. Data identification
3. Data acquisition and filtering
4. Data extraction
5. Data validation and cleaning
6. Data aggregation and representation
7. Data analysis
8. Data visualization
9. Utilization of analysis results


Week 2 – All about analytical thinking

Embrace your data analyst skills
Bao quát các kỹ năng của một chuyên viên phân tích dữ liệu

Key data analyst skills
Những kỹ năng mấu chốt của chuyên viên phân tích dữ liệu

  • Những kỹ năng phân tích là phẩm chất và đặc điểm gắn kết với việc sử dụng số liệu thực tế để giải quyết vấn đề.
  • Có nhiều khía cạnh về kỹ năng phân tích; tuy nhiên, bây giờ chúng ta chỉ chú trọng vào năm khía cạnh thiết yếu: sự ham học hỏi, khả năng nắm rõ bối cảnh, có tư duy chuyên môn, khả năng về thiết kế dữ liệu và xây dựng chiến lược sử dụng dữ liệu.
    (1) Curiosity is all about wanting to learn something.
    Tính ham học hỏi là việc muốn học mọi thứ,
    (2) Understanding the context is crucial.
    Việc hiểu được bối cảnh rất quan trọng.
    (3) A technical mindset involves the ability to break down things into smaller steps or pieces and work with them in an orderly and logical way.
    Tư duy chuyên môn bao hàm khả năng chia nhỏ vấn đề thành các phần hoặc các bước nhỏ hơn để có thể tiến hành phân tích theo trình tự và có logic.
    (4) Data design is how you organize information, just like the way you organize the contacts on your phone.
    Thiết kế dữ liệu là cách bạn tổ chức thông tin, giống với việc bạn sắp xếp các số điện thoại trong danh bạ điện thoại của mình vậy.
    (5) A data strategy is a management of the people (they know how to use the right data to find solutions), processes (the path to that solution is clear and accessible), and tools used in data analysis (the right technology is being used for the job).
    Chiến lược dữ liệu là việc quản trị con người (thành viên biết được cách sử dụng dữ liệu đúng cách để tìm ra giải pháp), quy trình và các công cụ được sử dụng trong việc phân tích dữ liệu (công nghệ đúng được sử dụng cho công việc).

Thinking about analytical thinking
Suy nghĩ về suy luận phân tích

All about thinking analytically
Tất tần tật về suy luận phân tích

Suy luận phân tích bao hàm việc nhận diện và định nghĩa một vấn đề trước khi giải quyết nó. Năm khía cạnh của suy luận phân tích gồm: trực quan hóa, chiến lược, định hướng của vấn đề, mối tương quan, bức tranh toàn cảnh và suy luận đào xâu vào chi tiết.

  • To solve a problem, we use data in an organized, step-by-step manner.
    Để giải quyết vấn đề, chúng ta sử dụng dữ liệu một cách có tổ chức và đi theo từng bước một.
  • Data analysts use a problem-oriented approach to identify, describe, and solve problems. They could identify correlations between two or more pieces of data.
    CVPT dữ liệu sử dụng cách tiếp cận hướng vấn đề để nhận diện, mô tả và giải quyết các vấn đề. CVPT có thể tìm hiểu mối tương quan giữa hai hoặc nhiều phần của dữ liệu.
  • A correlation is like a relationship; it does not equal causation.
    Tương quan giống quan hệ ảnh hưởng lên nhau; nó không bằng với quan hệ nhân quả.
  • Big-picture thinking helps you zoom out and see possibilities and opportunities, while detail-oriented thinking is about figuring out all aspects that will help you execute a plan.
    Suy nghĩ về bức tranh toàn cảnh giúp bạn phóng to để thấy rõ được khả năng và cơ hội, suy nghĩ hướng đến chi tiết là tìm ra rất cả các khía cạnh để giúp bạn thực hiện kế hoạch.
  • There are all kinds of problems in the business world that can benefit from employees who have a big-picture and detail-oriented way of thinking.
    Tất cả các loại vấn đề phát sinh trong doanh nghiệp đều có thể mang lợi ích cho nhân viên, những người có cái nhìn toàn cảnh và suy nghĩ hướng đến chi tiết.

Exploring core analytical skills
Khai phá những kỹ năng phân tích quan trọng nhất

  • The more ways you can think of, the easier it is to think outside the box and come up with fresh ideas.
    Bạn càng nghĩ theo nhiều hướng, càng dễ dàng hơn để suy nghĩ vượt khỏi “chiếc hộp” và nảy sinh được những ý tưởng mới.
  • In data analysis, solutions are seldom right in front of you.
    Trong phân tích dữ liệu, giải pháp hiếm khi xuất hiện trước mặt bạn.
  • You might naturally be an analytical thinker, but you can learn to think creatively and critically.
    Có thể bạn có năng lực suy nghĩ phân tích bẩm sinh, nhưng bạn có thể học thêm về suy nghĩ sáng tạo và suy nghĩ phản biện.
  • The Five Whys can reveal some surprising root causes for data analysis.
    Five Whys có thể làm sáng tỏ một số nguyên nhân gốc rễ đáng ngạc nhiên trong quá trình phân tích.
  • Gap analysis lets you examine and evaluate how a process works currently to get to where you want to be in the future.
    Phân tích chỗ thiếu hụt giúp bạn kiểm tra và đánh giá được quá trình hoạt động như thế nào và quá trình này đưa bạn đến đâu trong tương lai.
  • Businesses conduct gap analysis to do all kinds of things, such as improve a product or become more efficient.
    Phân tích khoảng thiếu hụt trong hoạt động doanh nghiệp là thực hiện một số hành động, như cải thiện sản phẩm hoặc làm cho doanh nghiệp hoạt động hiệu quả hơn.
  • The way data analysts think and ask questions affects how businesses make decisions.
    Cách mà CVPT dữ liệu suy nghĩ và đặt câu hỏi sẽ ảnh hưởng đến việc đưa ra quyết định của doanh nghiệp.

Thinking about outcomes
Suy nghĩ về kết quả

Using data to drive successful outcomes
Sử dụng dữ liệu để tạo ra kết quả thành công

  • In business, data-driven decision-making can improve results in different ways.
    Trong kinh doanh, việc đưa ra quyết dựa trên dữ liệu có thể cải thiện kết quả theo nhiều hướng khác nhau.
  • Data analysts can tap into the power of data to do all kinds of amazing things. They can gain valuable insights and verify their theories or assumptions.
    CVPT dữ liệu có thể tiếp xúc với sức mạnh của dữ liệu để làm được nhiều điều kinh ngạc. CVPT có thể đạt được nhiều thông tin quý giá và xác nhận được các giả thuyết và giả thiết của họ.
  • Data-driven decision-making increases your confidence in your decision and ability to address business challenges. It helps you to become more proactive when an opportunity presents itself, and it saves you time and effort when working toward a goal.
    Việc đưa ra quyết định dựa trên dữ liệu làm tăng sự tự tin trong các quyết định đưa ra và khả năng đối phó với các thách thức kinh doanh. Việc này giúp CVPT trở nên tiên phong hơn khi cơ hội đến với họ, giúp họ tiết kiệm thời gian và năng lượng đi đến đích.
  • Data analysts use context to make predictions, research answers, and draw conclusions.
    CVPT dữ liệu sử dụng bối cạnh để đưa ra các dự đoán, nghiên cứu câu trả lời và hoạch định các cách giải quyết vấn đề.
  • A data strategy incorporates the people, processes, and tools used to solve a problem. It gives you a high-level view of the path you should take to achieve your goals.
    Một chiến lược dữ liệu kết hợp con người, quy trình và các công cụ được sử dụng để giải quyết vấn đề. Điều này đem lại cho bạn một cái nhìn “cao” hơn về định hướng bạn nên theo để đạt được mục tiêu.
  • It is much more likely to be successful if everyone is on board and on the same page; thus, it is important to ensure that specific procedures are in place.
    Rất có khả năng sẽ thành công nếu mỗi người là thành viên trong nhóm và có cùng ý tưởng; do đó, thật sự quan trọng để đảm bảo rằng các quy trình chi tiết là đúng đắn.

Real-world data maigc
Phép màu của dữ liệu trong thế giới thực

  • Google’s HR department wanted to know whether there was any value in having managers. It looked at past performance reviews and employee surveys.
    Phòng Nhân sự của Google muốn biết các cấp quản lý có tạo ra giá trị cho công ty không. Họ nhìn vào các lần đánh giá năng suất làm việc trong quá khứ và thu thập khảo sát từ cấp nhân viên.
  • The Googlers had positive feelings about their managers. This confirmed that managers were valued and made a big difference.
    Nhân sự của Google có cảm nhận tích cực đối với cấp quản lý của họ. Điều này cho thấy cấp quản lý tạo ra giá trị và sự thay đổi lớn trong công ty.
  • Employees could nominate their favorite managers for what makes a great manager.
    Nhân viên có quyền chỉ định quản lý mà họ yêu thích
  • This data-driven decision continues to create an exceptional company culture for most of them.
    Quyết định dựa trên dữ liệu tiếp tục hình thành văn hóa công ty vượt trội.
  • The data analysts used a tracker to monitor story topics, clicks, web traffic, comments, shares, and more.
    CVPT sử dụng công cụ đánh dấu để quản lý các chủ đề, các cú click, lượng truy cập trang web, các bình luận, chia sẻ và nhiều hơn thế nữa.

Week 3 – The wonderful world of data

Follow the data life cycle
Theo sát vòng đời dữ liệu

Data phases and tools
Các công cụ và giai đoạn của dữ liệu

Cùng xem lại quá trình phân tích dữ liệu chia thành 6 giai đoạn sau:
asking ➜ preparing ➜ processing ➜ analyzing ➜ sharing ➜ acting
(xem lại chi tiết 6 quá trình tại đây)

Các công cụ phân tích dữ liệu gồm:
Spreadsheets – phần mềm xử lý bảng tính,
Databases – cơ sở dữ liệu,
Query languages – ngôn ngữ truy vấn dữ liệu,
Visualization softwares – phần mềm trực quan hóa dữ liệu,

Variations of th data life cycle
Một số biến thể của vòng đời dữ liệu

(1) Tóm tắt lại 6 bước dưới một biến thể khác:

  • Plan: Decide what kind of data is needed, how it will be managed, and who will be responsible for it.
    Lên kế hoạch: quyết định kiểu dữ liệu cần dùng là gì, quản lý nó như thế nào, ai sẽ chịu trách nhiệm việc này.
  • Capture: Collect or bring in data from a variety of different sources.
    Nắm bắt dữ liệu: thu thập dữ liệu từ nhiều nguồn khác nhau
  • Manage: Care for and maintain the data. This includes determining how and where it is stored and the tools used to do so.
    Quản trị: tập trung và duy trì dữ liệu. Hành động này bao hàm việc xác định dữ liệu sẽ được lưu trữ ở đâu và công cụ nào được sử dụng.
  • Analyze: Use the data to solve problems, make decisions, and support business goals.
    Phân tích: sử dụng dữ liệu để giải quyết vấn đề, đưa ra quyết định và hỗ trợ cho các mục tiêu của doanh nghiệp.
  • Archive: Keep relevant data stored for long-term and future reference.
    Nén: lưu trữ các dữ liệu liên quan trong thời gian dài và tham chiếu đến nó trương lai.
  • Destroy: Remove data from storage and delete any shared copies of the data.
    Hủy bỏ: xóa dữ liệu ra khỏi bộ nhớ và cũng xóa đi tất cả bản sao của chúng.

(2) U.S. Fish and Wildlife Service – 6 bước:

  • Plan – lập kế hoạch,
  • Acquire – thu được dữ liệu,
  • Maintain – duy trì dữ liệu,
  • Access – truy cập dữ liệu,
  • Evaluate – đánh giá mô hình,
  • Archive – nén dữ liệu.

(3) The U.S. Geological Survey (USGS) – 6 bước:

  • Plan – lập kế hoạch,
  • Acquire – thu được dữ liệu,
  • Process – xử lý dữ liệu,
  • Analyze – phân tích dữ liệu,
  • Preserve – bảo quản dữ liệu,
  • Publish/Share – công khai/chia sẻ dữ liệu.

(4) Financial Institutions – 7 bước:

  • Capture – thu thập dữ liệu,
  • Qualify – đánh giá chất lượng của dữ liệu,
  • Transfrom – chuyển hóa dữ liệu,
  • Utilize – sử dụng dữ liệu,
  • Report – báo cáo,
  • Archive – nén dữ liệu,
  • Purge (Destroy) – xóa dữ liệu.

(5) Harvard Business School (HBS) – 8 bước:

  • Generation – tạo ra,
  • Collection – thu thập,
  • Precessing – xử lý,
  • Storage – lưu trữ,
  • Management – quản lý,
  • Analysis – phân tích,
  • Visualization – trực quan hóa,
  • Interpretation – trình bày.

Outlining the data analysis process
Lên ý chính cho quá trình phân tích dữ liệu

Six phase of data analysis
Sáu giai đoạn phân tích dữ liệu

Một số ý chính:
• Phân tích dữ liệu không phải là một vòng đời; nó là quá trình phân tích dữ liệu,
• Làm việc với các bên liên quan là cách tốt nhất để đưa ra những câu hỏi hiệu quả cho việc xác định các vấn đề,
• Câu phát ngôn ngay liền trước là một phần của quá trình “đặt câu hỏi”. Nó sẽ giúp bạn tập trung không chỉ vào vấn đề của chính nó, mà còn trên dấu hiệu của nó.
• Giai đoạn “chia sẻ” và trực quan hóa dữ liệu là “thế mạnh” của CVPT dữ liệu.

Week 4 – Set up your toolbox

Hai chủ đề kiến thức trong tuần 4 gồm Mastering speadsheet basics và Basic SQL mình không đề cập trong bài viết này.

Data Visualization
Trực quan hóa dữ liệu

Planning a data visualization
Lập kế hoạch trực quan hóa dữ liệu

Các bước để lên kế hoạch cho giai đoạn trực quan hóa dữ liệu:

  • Step 1: Explore the data for patterns
    Bước 1: Khai phá mẫu hình dữ liệu
  • Step 2: Plan your visuals
    Bước 2: Lên kế hoạch sử dụng đồ thị
  • Step 3: Create your visuals
    Bước 3: Tạo đồ thị

Week 5 – Endless career possibilities

Các kiến thức trong tuần 5 chủ yếu nói về một số cơ hội nghề nghiệp cho vị trí phân tích dữ liệu và tầm quan trọng trong việc đưa ra quyết định kinh doanh công bằng. Mình không đề cập trong bài viết này.


Course 2 – Ask Questions to Make Data-Driven Decisions

Week 1 – Effective questions

Week 2 – Data-driven decisions

Week 3 – More spreadsheet basics

Week 4 – Always remember the stakeholder


Course 3 – Prepare Data for Exploration

Week 1 – Data types and structures

Week 2 – Bias, credibility, privacy, ethics, and access

Week 3 – Database: Where data lives

Week 4 – Organizing and protecting your data

Week 5 – Engaging in the data community (optional)


Course 4 – Process Data from Dirty to Clean

Week 1 – The importance of intergrity

Week 2 – Sparkling-clean data

Week 3 – Cleaning data with SQL

Week 4 – Verify and report on your cleaning results

Week 5 – Optional: Adding data to your resume


Course 5 – Analyze Data to Answer Questions

Week 1 – Organizing data to begin analysis

Week 2 – Formatting and adjusting data

Week 3 – Aggregating data for analysis

Week 4 – Performing data calculations


Course 6 – Share Data through the Art of Visualization

Week 1 – Visualizing data

Week 2 – Creating data visualizations with Tableau

Week 3 – Crafting data stories

Week 4 – Developing presentations and slideshows


Course 7 – Data Analysis with R Programming

Week 1 – Programming and data analytics

Week 2 – Programming using RStudio

Week 3 – Working with data in R

Week 4 – More about visualizations, aesthetics, and annotations

Week 5 – Documentation and reports


Course 8 – Google Data Analytics Capstone: Complete a Case Study

Week 1 – Learn about capstone basic

Week 2 – Building your portfolio

Week 3 – Using your portfolio (optional)

Week 4 – Putting your certificate to work

Leave a comment