class: center, middle, inverse, title-slide .title[ #
Feature Engineering Recipes
] .subtitle[ ## 👷 🧑🍳 🍳 ] .author[ ### Machine Learning in R
SMaRT Workshops
] .date[ ### Day 2B Jeffrey Girard ] --- class: inverse, center, middle # Recipes --- class: onecol ## Feature Engineering .left-column.pv3[ <img src="data:image/png;base64,#../figs/engineer.jpg" width="100%" /> ] .right-column.lh-copy[ **Prepare the predictors for analysis** - *Extract* predictors - *Transform* predictors - *Re-encode* predictors - *Combine* predictors - *Reduce* predictor dimensionality - *Impute* missing predictor values - *Select* and drop predictors ] --- class: onecol ## Recipes for Feature Engineering .left-column.pv3[ <img src="data:image/png;base64,#../figs/chef.jpg" width="100%" /> ] .right-column[ We will be learning the {recipes} package from {tidymodels} 1. Initiate a recipe using `recipe()` 2. Declare variable roles using `update_role()` (or a formula) 3. Include one or more preprocessing steps using `step_*()` 4. Add the recipe to our workflow using `add_recipe()` 5. Fit the model and {tidymodels} will take care of the rest! ] --- ## Two approaches to tidying #### The old way (mutate the original data frame) ``` r # Load and tidy data titanic <- read_csv("https://tinyurl.com/mlr-titanic") %>% * mutate( survived = factor(survived), pclass = factor(pclass), sex = factor(sex) ) ``` -- #### The new way (deal with it later using recipes) ``` r # Load data without tidying titanic <- read_csv("https://tinyurl.com/mlr-titanic") ``` --- ## Setting up the data splits ``` r # Create data splits, stratified by fare set.seed(2022) fare_split <- initial_split(data = titanic, prop = 0.8, strata = 'fare') fare_train <- training(fare_split) fare_test <- testing(fare_split) ``` ``` r # Set up model (linear regression using lm) lm_model <- linear_reg() %>% set_mode("regression") %>% set_engine("lm") ``` --- ## Initiating a recipe ``` r # Option 1: Set roles using a formula fare_recipe <- recipe(fare_train, formula = fare ~ pclass + sex + age + sibsp + parch) ``` -- ``` r # Option 2: Set roles using update_role() fare_recipe <- recipe(fare_train) %>% update_role(fare, new_role = "outcome") %>% update_role(pclass:parch, new_role = "predictor") %>% update_role(survived, new_role = "ignore") ``` .footnote[*Note.* I personally prefer `update_roles()` because it enables tidy selection and "ignored" variables.] --- class: onecol ## Including preprocessing steps ``` r # New recipe-based version fare_recipe <- fare_recipe %>% * step_mutate( survived = factor(survived, levels = c(1, 0)), pclass = factor(pclass), sex = factor(sex) ) ``` The benefit of making this a recipe step (instead of applying it to the original data)... ...is that it will now affect *any data* that you apply the recipe/workflow to! --- ## Using a recipe ``` r # Add the recipe (instead of the formula) to the workflow fare_wflow <- workflow() %>% add_model(lm_model) %>% * add_recipe(fare_recipe) ``` -- ``` r # Fit the model with this workflow (exactly as before) fare_fit <- last_fit(fare_wflow, fare_split) ``` --- class: twocol ## Common Steps .pull-left.lh-copy[ - **Calculate and transform:**<br /> `step_mutate()`, ... - **Categorical predictors:**<br /> `step_dummy()` - **Center and rescale:**<br /> `step_normalize()`, ... - **Non-normality:**<br /> `step_YeoJohnson()`, ... - *Interactions:*<br /> `step_interact()` - *Non-linearity:*<br /> `step_poly()`, ... ] .pull-right.lh-copy[ - **Missing values:**<br /> `step_naomit()`, `step_impute_*()`, ... - **Near-zero variance:**<br /> `step_nzv()` - **Multicollinearity:**<br /> `step_corr()` - **Linear combinations:**<br /> `step_lincomb()` - *Drop variables:*<br /> `step_rm()` - *Dimensionality reduction:*<br /> `step_pca()`, ... ] --- class: onecol ## Calculate and transform - Some variables will need to be calculated from existing values and variables - You may choose to score an instrument from item-level data - You may choose to encode a predictor as the ratio of two values - You may choose to calculate sums, means, counts, proportions, etc. .pv1[ - We can use `step_mutate()` for these purposes as well ] --- ## Calculate and transform ``` r cp_recipe <- fare_recipe %>% * step_mutate( * numfamily = sibsp + parch, * fa_ratio = fare / age * ) ``` -- <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:260px; "><table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> survived </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> fare </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> pclass </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> sex </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> age </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> sibsp </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> parch </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> numfamily </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> fa_ratio </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 39.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.0000000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 40.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.0000000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 49.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.0000000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 38.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.0000000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 42.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1797619 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.6500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 16.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4781250 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.6500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 25.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3060000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4016222 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2416667 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8875 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3033654 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2937500 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 25.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2820000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 38.0 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 0.2046053 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2887333 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2990385 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3927100 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3239583 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 35.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2014286 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 23.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3389478 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 45.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1605556 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3440476 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 23.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3065217 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2408333 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 13.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.5560923 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3612500 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 40.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1806250 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2918222 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 4.0125 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2006250 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3702381 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4305556 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3036846 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3927100 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0458 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 29.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0.2429586 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0.3295455 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3543545 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2833 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 18.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3936919 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3552632 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4377333 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3690476 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3690476 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 28.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2784214 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3272583 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 28.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2589286 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3682524 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3020833 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 31.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2494613 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 31.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2500000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3522727 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.6292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2543067 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 70.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1099291 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 35.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2255943 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2924370 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4155684 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 59.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1228814 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3211111 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 6.9500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2316667 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 29.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2672414 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2924370 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3295455 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4146947 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 17.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4644588 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 32.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2421875 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 33.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2392667 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 65.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1192308 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3145833 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4319444 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 16.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4859375 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.9750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 45.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1550000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 39.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 0.1853641 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 17.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 0.4252471 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 15.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 0.4819467 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 47.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1542553 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 40.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1913580 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4331000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.9500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3030462 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 16.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4833312 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 41.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1914634 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4092105 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 17.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4549000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 23.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3076255 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0.3020846 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3740095 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> NA </td> </tr> </tbody> </table></div> --- class: onecol ## Categorical predictors Categorical predictors can be re-encoded into multiple binary (0 or 1) predictors In `titanic`, `sex` is *female* or *male* and `pclass` is *1*, *2*, or *3* With dummy coding, you end up with `\(g-1\)` binary predictors `\((g\)` is number of levels) -- .pull-left.pad-table[ .center.imp[Two Levels] | sex | sex_male | |:------ |:--------:| | female | 0 | | male | 1 | ] -- .pull-right.pad-table[ .center.imp[Three Levels] | pclass | pclass_X2 | pclass_X3 | |:------ |:---------:|:---------:| | 1 | 0 | 0 | | 2 | 1 | 0 | | 3 | 0 | 1 | ] --- ## Categorical predictors ``` r dc_recipe <- fare_recipe %>% * step_dummy(sex, pclass) ``` -- <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:300px; "><table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> survived </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> fare </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> age </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> sibsp </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> parch </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> sex_male </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> pclass_X2 </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> pclass_X3 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 39.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 40.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 49.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> 38.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:right;"> 42.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.6500 </td> <td style="text-align:right;"> 16.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.6500 </td> <td style="text-align:right;"> 25.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8875 </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:right;"> 25.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:right;"> 38.0 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:right;"> 35.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:right;"> 23.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:right;"> 45.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:right;"> 23.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:right;"> 13.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:right;"> 40.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 4.0125 </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0458 </td> <td style="text-align:right;"> 29.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2833 </td> <td style="text-align:right;"> 18.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.7500 </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:right;"> 28.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:right;"> 28.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:right;"> 31.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> 31.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.6292 </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> 70.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:right;"> 35.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:right;"> 59.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:right;"> 22.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 6.9500 </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> 29.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:right;"> 17.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> 32.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:right;"> 33.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> 65.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:right;"> 16.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.9750 </td> <td style="text-align:right;"> 45.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:right;"> 39.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:right;"> 17.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:right;"> 15.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:right;"> 47.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> 40.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.9500 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:right;"> 16.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8500 </td> <td style="text-align:right;"> 41.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:right;"> 17.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:right;"> 23.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> </tr> </tbody> </table></div> --- class: onecol ## Center and rescale Predictors with vastly different means and SDs can cause problems for some algorithms -- .imp[Normalizing] a predictor sets its mean to `\(0.0\)` and its SD to `\(1.0\)` - This is accomplished by subtracting the mean and then dividing by the SD - This is also sometimes called "standardizing" or `\(z\)`-scoring the predictor -- ``` r # Normalize the age variable nr_recipe <- fare_recipe %>% * step_normalize(age) ``` .footnote[*Note.* {tidymodels} will use the *training set's* mean and SD to avoid data leakage from the testing set.] --- ## Center and rescale <img src="data:image/png;base64,#slides_2b_files/figure-html/normalizing-1.png" width="100%" /> .footnote[The mean is now 0.0 and the SD is now 1.0, but the shape of the distribution is unchanged.] --- class: onecol ## Non-normality A .imp[skewed] distribution is one that is not symmetric (i.e., it has a "heavy tail") A .imp[bounded] distribution is one that cannot go beyond certain boundary values <img src="data:image/png;base64,#slides_2b_files/figure-html/skew-1.png" width="90%" /> --- class: onecol ## Non-normality Specific transformations (e.g., log, inverse, logit) can help address specific issues The Box-Cox and Yeo-Johnson approaches employ **families of transformations** Box-Cox cannot be applied to negative or zero values, but .imp[Yeo-Johnson] can <br /> `$$x_{(yj)}^\star=\begin{cases}((x+1)^\lambda-1)/\lambda & \text{if } \lambda\ne0, x\ge0 \\ \log(x+1) & \text{if } \lambda=0, x\ge0 \\ -[(-x+1)^{2-\lambda}-1)]/(2-\lambda) & \text{if } \lambda\ne2, x<0 \\ -\log(-x+1) & \text{if } \lambda=2, x<0 \end{cases}$$` .footnote[ *Note.* The `\(\lambda\)` parameter will be estimated from the *training set* only. ] --- ## Non-normality ``` r yj_recipe <- fare_recipe %>% * step_YeoJohnson(fare) ``` -- <img src="data:image/png;base64,#slides_2b_files/figure-html/yjfare-1.png" width="100%" /> --- class: onecol ## Shortcuts and conveniences - Within recipes, there are shortcuts for selecting multiple variables - **Roles:** `all_outcomes()`, `all_predictors()` - **Types:** `all_numeric()`, `all_nominal()` - **Both:** `all_numeric_outcomes()`, `all_numeric_predictors()`, <br /> `all_nominal_outcomes()`, `all_nominal_predictors()` -- - We can also chain together multiple sequential steps via pipes<sup>1</sup> -- ``` r fare_recipe %>% step_normalize(all_numeric_predictors()) %>% step_dummy(all_nominal_predictors()) ``` .footnote[[1] The steps will be applied in *sequential* order, so build your recipe pipeline thoughtfully.] --- class: onecol ## Missing values - It is not uncommon for outcomes and predictors to have missing values -- - If we have marked these values correctly as `NA`, we can "impute" them - *To impute a missing value is to fill it in with a plausible value* - Imputation can be simple (e.g., fill in the mean, median, or mode) - Imputation can be complex (e.g., build a model to predict the value) - We will use a linear imputation model via `step_impute_linear()` -- - Imputing predictor values is fine when you are using cross-validation - But omit observations with missing outcome values using `step_naomit()` .footnote[*Note.* You can specify which variables to use in your imputation model via the `impute_with` argument.] --- ## Missing values ``` r na_recipe <- fare_recipe %>% * step_naomit(fare) %>% * step_impute_linear(age) ``` .footnote[*Note.* The default is to include all other predictor variables in the imputation model.] -- <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:300px; "><table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> survived </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> fare </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> pclass </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> sex </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> age </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> sibsp </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> parch </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 39.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 42.83699 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 42.83699 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 40.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 49.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 42.83699 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 38.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 32.44901 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 32.44901 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 32.44901 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 32.44901 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 42.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.6500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 16.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.6500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 25.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 18.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 30.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8875 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 25.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 38.00000 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 2 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 20.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 35.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 23.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 45.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 23.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 30.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 13.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 20.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 40.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 27.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.27841 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 4.0125 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 20.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 18.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.27841 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 20.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0458 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 29.00000 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.00000 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2833 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 18.50000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 19.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 18.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 21.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 28.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 28.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 31.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 31.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 22.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.6292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 30.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 70.50000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 35.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 19.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 59.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.50000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 6.9500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 30.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 29.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.27841 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 19.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 17.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.27841 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 32.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 33.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 65.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 18.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 16.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.9750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 45.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 39.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 2 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 17.00000 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 15.00000 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 47.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 40.50000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.27841 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 18.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 24.90522 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.27841 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.9500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.27841 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.27841 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 16.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 24.90522 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 41.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 19.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 17.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 23.50000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.00000 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.00000 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 24.90522 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> </tbody> </table></div> --- class: onecol ## Near-zero variance .imp[Zero variance predictors] take on only a single value in the sample - These predictors are **uninformative** and may lead to **modeling problems** -- .pv1[ .imp[Near-zero variance predictors] take on only a few unique values with low frequencies - These predictors can easily become zero-variance predictors during resampling ] -- <p style="padding-top:25px;">For many algorithms, we want to <b>detect</b> and <b>remove</b> both types of predictors</p> (This may not be necessary for algorithms with built-in *feature selection*) --- ## Nero-zero variance ``` r nzv_recipe <- fare_recipe %>% step_mutate( species = "homo sapiens", # will have zero variance over70 = age > 70 # will have near-zero variance ) %>% * step_nzv(all_predictors()) ``` -- <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:200px; "><table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> survived </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> fare </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> pclass </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> sex </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> age </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> sibsp </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> parch </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 39.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 40.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 49.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 38.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 42.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.6500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 16.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.6500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 25.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8875 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 25.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 38.0 </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 2 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 35.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 23.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 45.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 23.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 13.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 40.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 4.0125 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 20.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0458 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 29.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2833 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 18.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 28.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 28.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 31.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 31.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.6292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 70.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 35.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 59.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 6.9500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 30.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 29.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 27.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 22.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 17.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 32.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 33.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 65.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 24.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 16.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.9750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 45.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 39.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 2 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 17.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 15.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 47.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 40.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 18.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.9500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 16.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 41.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 19.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 17.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 23.5 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 26.0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 21.0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> NA </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> </tr> </tbody> </table></div> .footnote[*Note.* The `species` and `over70` variables were removed for having near-zero variance.] --- class: onecol ## Redundancy .imp[Highly correlated predictors] can lead to problems for some algorithms/procedures - The model has to randomly choose between the predictors, leading to **instability** - Model predictions may be fine, but model **interpretation** will often be obfuscated - The cutoff for "problematically high" correlations varies (e.g., 0.5 to 0.9 or higher) -- .pv1[ Predictors that are .imp[linear combinations] of other predictors are similarly problematic - Occurs if a predictor variable can be predicted from the other predictor variables - (This is why dummy coding creates `\(g-1\)` instead of `\(g\)` binary variables) ] -- <p style="padding-top:25px;">For many algorithms, we want to <b>detect</b> and <b>remove</b> redundant predictors</p> (This may not be necessary for algorithms with *regularization* or *feature selection*) --- ## Redundancy ``` r re_recipe <- fare_recipe %>% step_impute_linear(age) %>% step_mutate( wisdom = age / 100, # high correlation nfamily = sibsp + parch # linear combination ) %>% * step_corr(all_numeric_predictors(), threshold = 0.9) %>% * step_lincomb(all_numeric_predictors()) ``` -- <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:160px; "><table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> survived </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> fare </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> pclass </th> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> sex </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> sibsp </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> parch </th> <th style="text-align:right;position: sticky; top:0; background-color: #FFFFFF;"> wisdom </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3900000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4283699 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4283699 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4000000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4900000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4283699 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3800000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3244901 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3244901 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3244901 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 0.0000 </td> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3244901 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4200000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.6500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1600000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.6500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2500000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1800000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3000000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8875 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2600000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2400000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2500000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 0.3800000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2700000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2600000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2000000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2400000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3500000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2300000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4500000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2100000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2300000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3000000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1300000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2000000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4000000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2700000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2727841 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 4.0125 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2000000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2100000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1800000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2600000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2727841 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2000000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.0458 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2900000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2200000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2200000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2833 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1850000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1900000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1800000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2100000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2100000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2800000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2400000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2800000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2100000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2400000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3100000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3100000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2200000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.6292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3000000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.7050000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3500000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2700000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1900000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.5900000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2250 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2250000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 6.9500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3000000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2900000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2700000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2727841 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2200000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1900000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1700000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2727841 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3200000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.3300000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.6500000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2400000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1800000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1600000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.9750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4500000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 0.3900000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0.1700000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0.1500000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4700000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4050000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.0500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2727841 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1800000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2490522 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2727841 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 6.9500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2727841 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8792 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2600000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8958 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2727841 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1600000 </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:right;"> 7.7500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2490522 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.4100000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7750 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1900000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.7333 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.1700000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.2292 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2350000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2600000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.8542 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> male </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2100000 </td> </tr> <tr> <td style="text-align:left;"> 0 </td> <td style="text-align:right;"> 7.5500 </td> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> female </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0.2490522 </td> </tr> </tbody> </table></div> .footnote[*Note.* Here `age` was dropped due to its high correlation with `wisdom`, and `nfamily` was dropped due to being a linear combination of `sibsp` and `parch`.] --- ## Live Coding: Putting it all together .scroll.h-0l[ ``` r # Load data (without tidying it - we'll do that in the recipe) titanic <- read_csv("https://tinyurl.com/mlr-titanic") # Create data splits, stratified by fare set.seed(2022) fare_split <- initial_split(data = titanic, prop = 0.8, strata = 'fare') fare_train <- training(fare_split) fare_test <- testing(fare_split) # Set up model (linear regression using lm) lm_model <- linear_reg() %>% set_mode("regression") %>% set_engine("lm") # Prepare recipe fare_recipe <- recipe(fare_train) %>% update_role(fare, new_role = "outcome") %>% update_role(pclass:parch, new_role = "predictor") %>% update_role(survived, new_role = "ignore") %>% step_naomit(fare) %>% step_mutate( pclass = factor(pclass), sex = factor(sex) ) %>% step_dummy(all_nominal_predictors()) %>% step_impute_linear(age) %>% step_nzv(all_predictors()) %>% step_corr(all_numeric_predictors()) %>% step_lincomb(all_numeric_predictors()) %>% step_normalize(all_predictors()) # Prepare workflow fare_wflow <- workflow() %>% add_model(lm_model) %>% add_recipe(fare_recipe) # Set up metric set fare_ms <- metric_set(rmse, rsq, huber_loss, ccc) # Fit recipe and model to training set and calculate metrics in testing set fare_fit <- last_fit(fare_wflow, fare_split, metrics = fare_ms) # Examine metrics collect_metrics(fare_fit) ``` ] --- class: inverse, center, middle # Time for a Break!
−
+
60
:
00